2024年6月6日 星期四

[OpenAI] 關於 OpenAI @ 20240605

OpenAI

基于转换器的生成式预训练模型(英語:Generative pre-trained transformers,GPT)是一种大型语言模型(LLM),也是生成式人工智慧的重要框架。首个GPT由OpenAI于2018年推出。GPT模型是基于Transformer模型的人工神经网络,在大型未标记文本数据集上进行预训练,并能够生成类似于人类自然语言的文本。截至2023年,大多数LLM都具备这些特征,并广泛被称为GPT。
OpenAI发布了具有极大影响力的GPT基础模型,它们按顺序编号,构成了“GPT-n”系列。由于其规模(可训练参数数量)和训练程度的提升,每个模型相较于前一个都显著增强。其中最新的模型是GPT-4,于2023年3月发布。这些模型为更具任务特定性的GPT系统奠定了基础,包括经过微调以适应特定指令的模型——而这些又反过来为ChatGPT聊天机器人服务提供了支持 。
术语“GPT”还用于命名和描述其他开发者所开发的模型。例如,其他GPT基础模型包括EleutherAI开发的一系列模型,以及Cerebras开发的七个模型。此外,不同行业的公司还在其各自领域开发了执行特定任务的GPT,例如赛富时的“EinsteinGPT”(用于客户关系管理)和彭博的“BloombergGPT”(用于金融领域)。

沒有留言:

張貼留言

[7/5大地震] 關於 7/5大地震 @ 20250630

7/5大地震 汶川大地震發生於北京時間2008年5月12日(星期一)14时28分04秒,震央位於中國四川省阿坝藏族羌族自治州汶川縣映秀镇附近、四川省会成都市西北偏西方向79千米处。根据中国地震局的数据,此次地震的面波震级达8.0级、矩震級達8.3级,破坏地区超过10万平方公里。...