“日本GPT”競爭要爆發了?CyberAgent宣布自家日本LLM“開始使用”
5/11 IT媒體新聞
CyberAgent(東京澀谷區)於 5 月 11 日宣布了自己的日語 LLM(大型語言模型)。目前已經開發完成了多達130億個參數,據說已經開始用於廣告製作。
CyberAgent指出,“現有的LLM大多以英語學習為主,目前很少有日語和日本文化強的LLM。”。專門研究日語的 LLM 說,“將有可能生成比以前更自然的日語句子。” 此外,據透露,以“日本最大的LLM開發”為目標,在日本首次引進美國NVIDIA專門從事AI開發的超級計算機“DGX H100”。內部人工智能研發機構“AI Lab”和產品開發團隊將繼續研發,未來他們將通過以下舉措“為日本前語言處理技術的發展做出貢獻”產學合作。在大規模語言模型方面,美國OpenAI的“GPT-4”備受關注,美國Meta的“LLaMA”和英國Stability AI的“StableLM”也相繼亮相。本月10日(當地時間),美國谷歌也公佈了“PaLM 2”,運動愈演愈烈。甚至在日本,軟銀10日在財報發布會上宣布,正與LINE合作推出“日本GPT”,未來競爭有望加劇。
https://news.yahoo.co.jp/articles/238fba3d23f909517989c48f55bffea0c79804af
Blog comments