a级毛毛片_亚洲99_魔兽1~6集在线观看_黑白配在线观看_天天操日日操_四虎免费网站

首頁(yè) > 知識(shí)分享 > 知識(shí)分享 > OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

發(fā)布時(shí)間:2024-09-16 16:27:04

OpenAI 發(fā)布 o1-mini:更經(jīng)濟(jì)高效的推理模型

OpenAI 推出 o1-mini,一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型。o1-mini 在數(shù)學(xué)和編碼方面表現(xiàn)出色,接近 OpenAI o1 的水平,同時(shí)成本更低,速度更快。

一、o1-mini 簡(jiǎn)介

  • OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,尤其擅長(zhǎng)數(shù)學(xué)和編碼。
  • o1-mini 在 AIME 和 Codeforces 等評(píng)估基準(zhǔn)測(cè)試中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延遲更低,速率限制更高。

二、o1-mini 的優(yōu)勢(shì)

  • STEM 領(lǐng)域推理能力強(qiáng) :o1-mini 經(jīng)過(guò)專門(mén)優(yōu)化,在 STEM 領(lǐng)域表現(xiàn)出色,尤其在數(shù)學(xué)和編碼方面。
  • 成本效益高 :o1-mini 比大型語(yǔ)言模型更小,因此運(yùn)行成本更低,更適合實(shí)際應(yīng)用。
  • 速度更快 :o1-mini 的響應(yīng)速度比大型語(yǔ)言模型更快,例如在單詞推理問(wèn)題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現(xiàn)

領(lǐng)域

基準(zhǔn)測(cè)試

o1-mini

o1-preview

o1

GPT-4o

數(shù)學(xué)

AIME

70.0%

44.6%

74.4%

-

編碼

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科學(xué))

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 數(shù)學(xué)競(jìng)賽中取得了 70.0% 的成績(jī),與 o1 (74.4%) 相當(dāng),并優(yōu)于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 編碼競(jìng)賽中獲得了 1650 Elo 的評(píng)分,與 o1 (1673) 相當(dāng),并高于 o1-preview (1258)。
  • 在一些需要推理能力的學(xué)術(shù)基準(zhǔn)測(cè)試中,例如 GPQA (科學(xué)) 和 MATH-500,o1-mini 的表現(xiàn)優(yōu)于 GPT-4o。
  • 在人類偏好評(píng)估中,o1-mini 在需要推理能力的領(lǐng)域優(yōu)于 GPT-4o,但在語(yǔ)言類領(lǐng)域則不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用與 o1-preview 相同的對(duì)齊和安全技術(shù)進(jìn)行訓(xùn)練。
  • 在內(nèi)部版本的 StrongREJECT 數(shù)據(jù)集上,o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標(biāo)

GPT-4o

o1-mini

對(duì)有害提示的拒絕率(標(biāo)準(zhǔn))

0.99

0.99

對(duì)有害提示的安全完成率(挑戰(zhàn):越獄和邊緣案例)

0.714

0.932

對(duì)良性邊緣案例的合規(guī)性(“不過(guò)度拒絕”)

0.91

0.923

Goodness@0.1 StrongREJECT 越獄評(píng)估

0.22

0.83

人工來(lái)源的越獄評(píng)估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主題(如日期、傳記和冷知識(shí))方面的知識(shí)儲(chǔ)備有限。

六、未來(lái)展望

  • OpenAI 將在未來(lái)版本中改進(jìn) o1-mini 在非 STEM 領(lǐng)域的知識(shí)儲(chǔ)備。
  • OpenAI 還將嘗試將 o1-mini 擴(kuò)展到其他模態(tài)和 STEM 以外的專業(yè)領(lǐng)域。

OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,在數(shù)學(xué)和編碼方面表現(xiàn)出色。o1-mini 比大型語(yǔ)言模型更經(jīng)濟(jì)、更快,是需要推理能力但對(duì)世界知識(shí)要求不高的應(yīng)用的理想選擇。

來(lái)源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 發(fā)布,注重隱私保護(hù)的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發(fā)布! 這是 LibreOffice 24.8 系列的第一個(gè)次要版本 ,適用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特點(diǎn)

  • 注重隱私: LibreOffice 24.8 系列專為注重隱私的辦公套件用戶而優(yōu)化,他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰(shuí)共享他們創(chuàng)建的內(nèi)容。
  • 功能豐富: LibreOffice 提供了一系列界面選項(xiàng),以適應(yīng)不同的用戶習(xí)慣,從傳統(tǒng)到現(xiàn)代,并通過(guò)優(yōu)化桌 面上的可用空間,最大限度地利用不同的屏幕尺寸,只需點(diǎn)擊一兩次即可實(shí)現(xiàn)最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技術(shù)引擎,可提供更好的用戶體驗(yàn),并生成基于兩種可用 ISO 標(biāo)準(zhǔn)的相同且完全可互操作的文檔:開(kāi)放文檔格式 (ODT、ODS 和 ODP) 和專有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企業(yè)級(jí)支持: TDF 強(qiáng)烈推薦生態(tài)系統(tǒng)合作伙伴提供的 LibreOffice Enterprise 系列應(yīng)用程序,適用于桌面、移動(dòng)和云,具有廣泛的專用增值功能和其他優(yōu)勢(shì),例如 SLA。

知識(shí)分享更多>>

谷歌Gemini 3.1 Pro新王登場(chǎng),一口氣手搓Win11操作系統(tǒng),造出模擬城市app,SVG效果絕了 4.769 GHz!AMD Radeon RX 9060 XT刷新顯卡超頻紀(jì)錄 PVD“鋁坨坨”:雷蛇發(fā)布獵魂光蛛Signature Edition光軸鍵盤(pán) 微軟更新Mac版OneDrive 26.017:?jiǎn)⒂迷鷮?duì)話框、重塑活動(dòng)中心 Gemini 3.1 Pro上線,春節(jié)AI大戰(zhàn)硅谷更熱鬧 谷歌Gemini上線音樂(lè)模型 一句話即可生成歌曲 全網(wǎng)首例:用戶反饋其iPhone Air的蘋(píng)果自研5G基帶硬件故障 奔馳預(yù)告全新豪華純電MPV VLE:能自動(dòng)泊車、后輪轉(zhuǎn)向 全新Q5L上市、全新A6L首秀!越過(guò)千萬(wàn)輛之巔的奧迪,再度啟航 現(xiàn)代帕里斯帝獲得北美年度汽車! 一份年度成績(jī)單,再證CR-V“全維度”哲學(xué) 上汽大眾首款9系旗艦ID. ERA 9X亮相:一款車,一場(chǎng)轉(zhuǎn)型的宣言 極狐喬心昱:北汽新能源自動(dòng)駕駛技術(shù)全覆蓋 L3級(jí)至L4級(jí)全貫通 50萬(wàn)內(nèi)實(shí)用標(biāo)桿?廣汽本田新款飛度正式上市 煥新價(jià)6.68萬(wàn)元 央視鏡頭直擊-21℃極寒戰(zhàn)場(chǎng)!東風(fēng)睿立達(dá)完成中汽冬測(cè),破解物流凍阻難題 本田汽車近日官宣品牌標(biāo)識(shí)煥新計(jì)劃,沿用多年的經(jīng)典\"H\"標(biāo)將升級(jí)為全新設(shè)計(jì)版本,新標(biāo)識(shí)定于2027年正式啟用 星動(dòng)紀(jì)元與順豐科技簽約,推動(dòng)具身智能機(jī)器人在供應(yīng)鏈落地 德系豪華三強(qiáng),連續(xù)兩年失守中國(guó)市場(chǎng) 萬(wàn)能的《甄嬛傳》,在迅雷反腐這兒就失靈了? 沃爾沃EX60純電SUV將搭載谷歌Gemini AI,配大尺寸豎屏 聯(lián)發(fā)科發(fā)布天璣9500s:3nm工藝,支持硬件級(jí)光線追蹤技術(shù) 消息稱鴻蒙智行1月20日前后分批推送華為乾崑智駕ADS 4.1 美運(yùn)營(yíng)商Verizon服務(wù)中斷十小時(shí):波及數(shù)十萬(wàn)人,官方承諾補(bǔ)償 金融時(shí)報(bào):蘋(píng)果避開(kāi)AI燒錢(qián)大戰(zhàn),卻成為谷歌與OpenAI的“造王者” 李小龍透露華為手表市場(chǎng)份額超手機(jī),國(guó)內(nèi)超30%使用非華為手機(jī) 賈國(guó)龍確認(rèn):西貝將關(guān)閉102家門(mén)店 “酸菜魚(yú)之王”賣不動(dòng)了? 太二親手拆招牌,轉(zhuǎn)戰(zhàn)川菜賽道 日本霸占20年的汽車銷量第一寶座,2026年被中國(guó)掀翻了? 為何中國(guó)茶業(yè)跑不出一個(gè)「茅臺(tái)」? 房企聚焦核心城市“掐尖”,北上杭三城2025年土地出讓收入均超千億元
主站蜘蛛池模板: 婷婷在线视频观看 | 鬼吹灯之天星术在线观看 | 国产精品久久 | 国产免费看黄 | 少妇精品一区二区三区 | 亚洲视频一二三 | 亚洲成人av免费 | 在线观看你懂的视频 | 激情婷婷久久 | 性色av一区二区三区 | 亚洲天天 | 午夜在线观看免费视频 | 伊人影院中文字幕 | 成人激情视频在线观看 | 蜜桃成人免费视频 | 亚洲四虎影院 | 国产精品久久久久久中文字 | 九九热视频在线观看 | 韩国久久| 天天干天天操天天干 | 好吊日av | 日韩欧美亚 | 亚洲最黄视频 | 疯狂试爱三2浴室激情视频 超碰.com | 亚州视频在线 | 97香蕉久久夜色精品国产 | 亚洲免费视频观看 | 国产午夜伦理 | 毛片的网址 | 在线观看国产精品视频 | 欧美9999 | 欧美三级视频在线播放 | 日韩黄色小视频 | 国产区精品在线 | 日韩资源在线观看 | √8天堂资源地址中文在线 亚洲成人黄色片 | 五月婷在线视频 | 91成人免费看 | 亚洲性久久 | 国产日韩欧美激情 | 亚洲区小说区图片区qvod |