制作者:森重 真純(Galirage)
更新日時:2024年12月24日
<aside> 💬
以下のZenn記事に、より整理された情報をまとめました◎
https://zenn.dev/galirage/articles/openai-12-days
</aside>
https://youtu.be/iBfQTnA2n2s?si=kXiXlIv06pYRZH4z
「12 Days of OpenAI」の始まりを告知
初日には2つの発表があると紹介
o1モデルの正式版(フルバージョン)をリリース
「o1モデルのパフォーマンス比較グラフ:競技数学(AIME 2024)、競技プログラミング(CodeForces)、PhD レベルの科学的質問(GPQA Diamond)における、GPT-4、o1 preview、o1の精度比較を示すグラフ。全ての分野でo1が最高性能を示している。」
新たなサブスクリプションプラン「ChatGPT Pro」の発表
o1モデルの具体的なデモ
コーディング、速度、高難度問題、マルチモーダルへの対応などが紹介される。
Roman emperorsのリストを生成するデモ。
システム図の画像からの推論などをデモ。
「ChatGPT Pro」のデモ
競技化学のような非常に難しい問題に対して、o1 pro modeを使い、数分考えるケースを紹介。
「思考が長くなる(数分単位で計算する)」場合にpro modeが活用できるシーンを説明。
APIにo1を今後提供する計画に言及
https://youtu.be/yCIYS9fx56U?si=V3YqlIiIO7xvoQAZ
o1モデルのAPI提供に向けたカスタマイズ機能「強化学習型ファインチューニング(Reinforcement Fine-Tuning = RFT)」を発表
RFT(Reinforcement Fine-Tuning)の背景とメリット
研究者や企業向けのプレビュー提供
実例デモ: 遺伝子疾患研究への応用
「o1 RFT」を活用するためのAPIワークフロー例