2024年6月6日 星期四

[OpenAI] 關於 OpenAI @ 20240605

OpenAI

基于转换器的生成式预训练模型(英語:Generative pre-trained transformers,GPT)是一种大型语言模型(LLM),也是生成式人工智慧的重要框架。首个GPT由OpenAI于2018年推出。GPT模型是基于Transformer模型的人工神经网络,在大型未标记文本数据集上进行预训练,并能够生成类似于人类自然语言的文本。截至2023年,大多数LLM都具备这些特征,并广泛被称为GPT。
OpenAI发布了具有极大影响力的GPT基础模型,它们按顺序编号,构成了“GPT-n”系列。由于其规模(可训练参数数量)和训练程度的提升,每个模型相较于前一个都显著增强。其中最新的模型是GPT-4,于2023年3月发布。这些模型为更具任务特定性的GPT系统奠定了基础,包括经过微调以适应特定指令的模型——而这些又反过来为ChatGPT聊天机器人服务提供了支持 。
术语“GPT”还用于命名和描述其他开发者所开发的模型。例如,其他GPT基础模型包括EleutherAI开发的一系列模型,以及Cerebras开发的七个模型。此外,不同行业的公司还在其各自领域开发了执行特定任务的GPT,例如赛富时的“EinsteinGPT”(用于客户关系管理)和彭博的“BloombergGPT”(用于金融领域)。

沒有留言:

張貼留言

[黃紹庭] 關於 黃紹庭 @ 20240927

黃紹庭 黃紹庭(1970年1月11日—),台灣政治人物,生於高雄市,其父為高雄市議員黃芳仁(合併改制前第2屆至第5屆高雄市議員);畢業於東海大學物理學系、美國南加州大學電機工程碩士班。曾任台積電駐美國技術經理,曾任合併改制前第七屆高雄市議員(期間因雙重國籍遭解職)。現任中國國民...