[OpenAI] 關於 OpenAI @ 20240605

2024年6月6日星期四

[OpenAI] 關於 OpenAI @ 20240605

OpenAI

基于转换器的生成式预训练模型（英語：Generative pre-trained transformers，GPT）是一种大型语言模型（LLM），也是生成式人工智慧的重要框架。首个GPT由OpenAI于2018年推出。GPT模型是基于Transformer模型的人工神经网络，在大型未标记文本数据集上进行预训练，并能够生成类似于人类自然语言的文本。截至2023年，大多数LLM都具备这些特征，并广泛被称为GPT。
OpenAI发布了具有极大影响力的GPT基础模型，它们按顺序编号，构成了“GPT-n”系列。由于其规模（可训练参数数量）和训练程度的提升，每个模型相较于前一个都显著增强。其中最新的模型是GPT-4，于2023年3月发布。这些模型为更具任务特定性的GPT系统奠定了基础，包括经过微调以适应特定指令的模型——而这些又反过来为ChatGPT聊天机器人服务提供了支持。
术语“GPT”还用于命名和描述其他开发者所开发的模型。例如，其他GPT基础模型包括EleutherAI开发的一系列模型，以及Cerebras开发的七个模型。此外，不同行业的公司还在其各自领域开发了执行特定任务的GPT，例如赛富时的“EinsteinGPT”（用于客户关系管理）和彭博的“BloombergGPT”（用于金融领域）。

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)

一天一新聞

2024年6月6日星期四