移至主內容
ThinDeep 瑞泰創新科技
CAPTCHA
圖片的 CAPTCHA
Get new captcha!
請輸入圖片上的文字。
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.

主導覽

  • 首頁
CAPTCHA
圖片的 CAPTCHA
Get new captcha!
請輸入圖片上的文字。
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
使用者帳號選單
  • 登入

導航連結

  1. 首頁

大規模語言模型

By ThinDeep, 12 五月, 2023

大規模語言模型現狀的總結截至2023年4月末

去年末以來,引起了廣泛關注的ChatGPT以及其內部版本GPT-3.5和GPT-4,都是由名為OpenAI的美國企業獨家提供的大規模語言模型(LLM),並得到了Microsoft的強力支持。

與此相應,Meta公司推出了LLaMA(LaMa),隨後出現了一系列衍生模型,包括在LLaMA與ChatGPT的13,000次對話數據上進行微調的Alpaca(阿爾帕卡),以及在Alpaca和ShareGPT(與GPT的對話由志願者公開提供的數據)上進行微調的Vicuna(維庫尼亞)等。

然而,由於Meta公司的意向,LLaMA被限制為「僅限學術用途」。此外,

根據OpenAI的使用條款,GPT的輸出結果不能用於創建能夠對抗GPT的強大人工智能,這就限制了Alpaca和Vicuna在學術研究目的以外的應用(有時也被形容為「污染」)。

特別是Vicuna經過志願者的不斷改進,可以在家庭使用的計算機上運行,如果能應用於企業內部信息系統或遊戲軟件等領域,將會非常有用。因此,限制其僅用於學術目的是非常可惜的。

為了克服這種情況,Databricks公司創建了一個由其5000名員工創建的「乾淨」的1.5萬次對話數據集,並以「Dolly-v2」的形式對外公開。這是首個完全開放且自由的大規模語言模型。

大規模語言模型
RSS feed

Language switcher

  • English
  • Chinese, Simplified
  • Chinese, Traditional
  • Japanese
  • German
  • French
  • Korean
  • Italian
  • Russian
  • Portuguese, Brazil
  • Spanish
Powered by Drupal

Tag Cloud

1776Adob​​e IllustratorAEAIAIdeaLabAI FontAIGCAI LabAILabs.twAI monitoringAIPAI SentryAI人權AI佛AI佛祖AI哨兵AI字型AI字體AI戦略会議AI搜尋引擎AI教育AI模型AI白皮書AI算力AI造字AI醫療AMDAndrew NgAPBig DataBipedCAMPFIREChatGPTCNNCyber​​AgentDecentralized VPNDeeper NetworkDeep LearningDeepLearning.aiDeepMindDeepSeekDGX H100DPNDPRElon MuskFoxNewsGANGenerative AIGGUFGoogleGPTGPT-4HotokeHotoke AIHuaTuoHuggingFaceHyperCLOVAIPAJapan AIJDLAKazuma IeiriLaMDALINELINE AiCallLLaMALLMLLM ChatbotMax TegmarkMicrosoftMira MuratiMLPOllamaOpenAIOptimusPaLM 2PANSPerplexityPythonQuadrupedQwenQwen2.5Qwen3RIKENRNNRobotSal KhanSciMakerSEOStability AIStockGPTTAIDETAIGUUTaiwanProTedThinDeepTransformerTruthGPTUBIViral LoopVLVPNWorks Mobile JapanX.AIX.AI CorpYCYOLOYOLOv9Yuval Noah Hararizi2zizi2zi-pytorch上海世界AI大會世界AI大會中國AI五笔笔形亞洲無人機AI創新應用研發中心亞洲航空公司人工智慧監測人工通用智慧六種深度神經網路模型北京人工智能白皮書千問千問3台灣AI白皮書台灣人工智慧實驗室史塔克股神吳恩達和製GPT大模型大規模言語大規模語言模型大語言模型天空飛行科技公司孫正義宮川潤一家入一真岡野原大輔岸田文雄工藤郁子平將明徐挺耀微軟情報處理推進機構提示詞文心文心大模型新創公司日本AI日本AI白皮書日本GPT日本LLM智慧醫療東京大學松尾豊松尾豐楊立昆機器人機械佛永字八法深度學習 深度求索深度求索深度神經網路模型無人機無人機產業無條件基本收入特斯拉特斯拉機器人理化学研究所生命之未來研究所生成AI生成式AI生成式 AI 的使用指南百度百度輸入法盤古大模型眾籌神經網路模型筆跡經濟學人総理大臣官邸美國國家科學院群眾募資義竹脳情報通信融合研究センター自民黨自駕車英國AI白皮書華駝蘇姿丰越獄版軟銀軟體銀行輝達通用人工智慧通義千問鐵馬克開源大型語言模型阿特曼阿里巴巴陸奇雅虎革新知能統合研究センター顏擇雅飛槳數據馬斯克

Links

機器人叫獸Youtube頻道 | 暴龍隊Youtube頻道 | 台灣機器人學校Youtube頻道 | Ubipilot 輔助駕駛 Youtube頻道 

Pi10t | 機器人叫獸 | HARU | 暴龍隊 | ThinDeep | TAIBOT | Ubipilot | Robot School | LEE School | LEE, Shih-yuan | Haru Tel  | Zeison  | Powro