中文字幕精品av乱码在线,国精品无码一区二区三区,精品国产一区二区在线观看

自8月8號(hào)GPT-5正式發(fā)布以來(lái)，這款產(chǎn)品的口碑似乎一直不怎么樣，吐槽此起彼伏。

GPT-5在發(fā)布前打出的旗號(hào)，是一款具有博士水平智能的AI產(chǎn)品。

官方似乎非常自信，直接下架了以前的舊模型，表示GPT-5可以“吊打一切”。

不過(guò)僅僅幾天，就因?yàn)槭褂皿w驗(yàn)遭到反噬，被迫緊急恢復(fù)舊版模型使用。

事實(shí)上，從測(cè)試和跑分的角度來(lái)看，GPT-5的技術(shù)優(yōu)勢(shì)確實(shí)非常明顯。

不僅如此，官方也在評(píng)估中特意強(qiáng)調(diào)了GPT-5在數(shù)學(xué)、真實(shí)世界編碼、多模態(tài)理解和健康方面的過(guò)人之處。

不少評(píng)測(cè)人員表示，現(xiàn)在的GPT-5是完完全全的“理科生”。

在科學(xué)和技術(shù)領(lǐng)域，它的表現(xiàn)相當(dāng)出色。解數(shù)學(xué)難題、編寫(xiě)復(fù)雜代碼是它的拿手好戲。

而GPT-5的智商上限雖然有所提高，卻表現(xiàn)出了極高的“不穩(wěn)定性”。

有的時(shí)候，它也會(huì)在簡(jiǎn)單的問(wèn)題上犯錯(cuò)。

此外，它在面對(duì)原先擅長(zhǎng)的寫(xiě)郵件、閱讀理解等涉及人類(lèi)情感的任務(wù)時(shí)，就像一個(gè)機(jī)器人。

創(chuàng)意能力也并未發(fā)現(xiàn)明顯提升，因此GPT-5的實(shí)用性飽受質(zhì)疑。

不過(guò)，大家最難以接受的原因，是它的“情商”跌破了用戶(hù)的下限。

它不再是以前那個(gè)什么都能聊的網(wǎng)友，而是變成了一個(gè)專(zhuān)業(yè)的工作學(xué)習(xí)助手。

智商上升，情商下降，GPT-5反而變得更不好用了。

因此，在發(fā)布后的72小時(shí)內(nèi)，OpenAI就收到了大量的退訂訴求。

被忽視的提示詞指南

其實(shí)，在GPT-5發(fā)布的前一天，OpenAI發(fā)布了一篇GPT-5的提示詞指南。

這份指南中給出了一些用戶(hù)平時(shí)可能不會(huì)注意的使用技巧，并通過(guò)解釋部分運(yùn)行機(jī)制回應(yīng)了外界的質(zhì)疑。

更重要的是，它解釋了一個(gè)重要的事實(shí)：

并非GPT-5變得不好用了，而是用戶(hù)與AI的交互方式還停留在上一個(gè)時(shí)代。

還記得我們先前談過(guò)的提示詞工程的重要性嗎？

很多人總是習(xí)慣于把GPT-5這類(lèi)AI產(chǎn)品當(dāng)作一個(gè)搜索引擎或者“工具人”來(lái)使用，但GPT-5已經(jīng)進(jìn)化成了一個(gè)擁有自主規(guī)劃和深度思考能力的“數(shù)字心智”。

因此，老舊的溝通方式自然是無(wú)法生效，是時(shí)候進(jìn)行“強(qiáng)制更新”了。

首先，先來(lái)看下GPT-5的變化。

根據(jù)指南中的內(nèi)容，它的核心進(jìn)化分為四個(gè)方面：

1.智能體任務(wù)性能（Agentic Task Performance）：

它不再是那個(gè)“問(wèn)一句答一句”的人機(jī)客服了。

現(xiàn)在的GPT-5，更像是一個(gè)項(xiàng)目經(jīng)理。

它能夠理解較為復(fù)雜的目標(biāo)，自主規(guī)劃完成的步驟，選擇合適的工具，并持續(xù)工作直至任務(wù)完成。

2.編碼能力（Coding）

前段時(shí)間，我們發(fā)布了一篇測(cè)評(píng)國(guó)內(nèi)AI大模型寫(xiě)代碼的能力的文章。

如果把以前的AI比作程序員，那GPT-5可以稱(chēng)的上是一名全棧工程師。

它能夠處理大型代碼庫(kù)的重構(gòu)、修復(fù)較為復(fù)雜的Bug，甚至能夠從零起步構(gòu)建一個(gè)功能完備的應(yīng)用。

3.原始智能（Raw Intelligence）

相比舊版本模型，GPT-5擁有更強(qiáng)的邏輯推理能力、常識(shí)理解能力和創(chuàng)造力。

當(dāng)然，考慮到GPT-5先前差評(píng)如潮的情況，這一方面還要打個(gè)問(wèn)號(hào)。

4.可引導(dǎo)性（Steerability）

這才是我們要關(guān)注的核心。

GPT-5對(duì)指令的細(xì)微差別非常敏感。

因此，用戶(hù)可以像使用科研儀器一樣，精確控制它的行為、語(yǔ)氣和輸出風(fēng)格。

除此之外，官方還推薦了一個(gè)新工具，名為Responses API。

今年5月21日，OpenAI宣布擴(kuò)展Responses API，支持遠(yuǎn)程連接MCP服務(wù)器、圖像生成等功能，用于幫助開(kāi)發(fā)者構(gòu)建更智能的智能體應(yīng)用。

這個(gè)工具的應(yīng)用，好比給GPT-5額外加裝了一個(gè)“短期記憶芯片”。

過(guò)去與AI交互，經(jīng)常需要復(fù)述上下文背景，從而浪費(fèi)大量tokens，徒增成本。

而現(xiàn)在，只需要傳遞一個(gè)“previous_response_id”，就可以讓AI記住上一步的思考過(guò)程和推理鏈。

官方數(shù)據(jù)顯示，GPT-5在Tau-Bench測(cè)試（零售場(chǎng)景）中的分?jǐn)?shù)由73.9%提升至78.2%。

簡(jiǎn)單來(lái)說(shuō)，就是性能更好、延遲更低、成本更省。

對(duì)于所有需要多個(gè)步驟完成的復(fù)雜任務(wù)，Responses API恐怕將成為必選項(xiàng)。

馴服AI智能體

GPT-5自Chatbot進(jìn)化為智能體后，其雙刃劍效應(yīng)變得更加明顯。

用好了，它能實(shí)現(xiàn)博士級(jí)別的智能；用不好，它就又變回了“人工智障”。

OpenAI把這種雙刃劍效應(yīng)定義為智能體急切性（Agentic Eagerness）。

因此，用戶(hù)在使用GPT-5時(shí)面臨的最大難題，是如何成為一個(gè)優(yōu)秀的“馴獸師”。

指南中給出了下面幾個(gè)應(yīng)用場(chǎng)景：

1.追求效率與簡(jiǎn)潔：即如何“拉住韁繩”

GPT-5差評(píng)啟示錄：用戶(hù)與AI交互方式還停留在上一個(gè)時(shí)代

適用場(chǎng)景：任務(wù)明確、需要快速得出答案、不需要AI節(jié)外生枝。

在使用各類(lèi)AI產(chǎn)品的時(shí)候，各位肯定都經(jīng)歷過(guò)，明明只是想讓AI給出一個(gè)簡(jiǎn)單、易于理解的答案，但AI卻要思考半天，然后列出一大段讓人壓根不想看也沒(méi)必要看的內(nèi)容。

OpenAI給出了兩種解決方法：

一是降低推理強(qiáng)度（reasoning_effort）。

這是一個(gè)API的參數(shù)，用戶(hù)可以把它設(shè)置成low或medium。

這就像告訴一名員工：“別想太多，照著流程走，快速給我結(jié)果。”

二是在提示詞中設(shè)立“紅綠燈”。

首先，要明確目標(biāo)與方法，告訴AI“快”才是第一要?jiǎng)?wù)；

其次，設(shè)定提前停止標(biāo)準(zhǔn)，如“只要找到XX，就立刻停止搜索”，打斷它復(fù)雜的思考過(guò)程；

再次，設(shè)置工具調(diào)用預(yù)算，規(guī)定AI“最多只能調(diào)用兩次聯(lián)網(wǎng)搜索”；

最后，提供“逃生艙口”，加入一句“即使答案可能不完全正確”，避免AI為了追求100%正確而進(jìn)行過(guò)度思考和探索。

看完這部分內(nèi)容，感覺(jué)OpenAI又把我的AI世界觀給“強(qiáng)制刷新”了一遍。

以前我在用AI的時(shí)候，最多是在提示詞結(jié)尾加一句“只需要告訴我XX即可，不要添加額外內(nèi)容”。

但拋開(kāi)修改API參數(shù)不談，我確實(shí)沒(méi)想到還可以通過(guò)限制搜索次數(shù)，甚至是不要求答案完全正確的方式來(lái)加快AI的運(yùn)行。

2.鼓勵(lì)自主與探索：即如何“放手一搏”

GPT-5差評(píng)啟示錄：用戶(hù)與AI交互方式還停留在上一個(gè)時(shí)代

適用場(chǎng)景：任務(wù)復(fù)雜、目標(biāo)模糊、需要AI進(jìn)行深入研究和自主決策

另一種經(jīng)常在使用AI時(shí)遇到的情況是，在我們只有一個(gè)初期目標(biāo)或者大方向時(shí)，需要AI給出一套完善的思路、框架時(shí)，AI只能給出一個(gè)“半成品”。

與前面對(duì)應(yīng)，OpenAI同樣提供了兩種方法：

一是提高推理強(qiáng)度（reasoning_effort）。

也就是把API的參數(shù)設(shè)為high，告訴員工“給你充分授權(quán)，動(dòng)用一切資源，把問(wèn)題研究透徹”。

二是在提示詞中注入“信念感”。

指南中的這一段內(nèi)容直接翻譯過(guò)來(lái)有點(diǎn)抽象，但核心思路很簡(jiǎn)單：

明確告訴AI遇到困難時(shí)要怎么辦，而不是停下來(lái)求助用戶(hù)。

3.善用工具前導(dǎo)提示：讓AI“匯報(bào)工作”

在完成工程量較大的復(fù)雜任務(wù)時(shí)，為了避免AI成為一個(gè)悶頭干活的“黑箱”，可以要求AI定期進(jìn)行匯報(bào)。

操作很簡(jiǎn)單，在提示詞中加入對(duì)匯報(bào)風(fēng)格和頻率的要求即可。

然后，用戶(hù)就可以看到一份類(lèi)似表格、結(jié)構(gòu)清晰的報(bào)告（即JSON格式），包含AI的思考摘要、當(dāng)前執(zhí)行的任務(wù)和下一步的計(jì)劃。

在復(fù)雜的智能體中，這種類(lèi)似于print()函數(shù)的監(jiān)控和調(diào)控過(guò)程是非常重要的。

從規(guī)劃到執(zhí)行的全流程優(yōu)化

除去系統(tǒng)性的說(shuō)明，這份指南中還給出了一些來(lái)自一線客戶(hù)的“寶貴經(jīng)驗(yàn)”。

我們?nèi)匀挥靡恍?yīng)用場(chǎng)景來(lái)說(shuō)明：

1.讓AI成為“架構(gòu)師”

適用場(chǎng)景：從零開(kāi)始構(gòu)建新應(yīng)用

目前，AI產(chǎn)品正在實(shí)現(xiàn)“低門(mén)檻”的目標(biāo)。

各行各業(yè)的用戶(hù)都在頻繁地使用AI，但大部分用戶(hù)都不可能同時(shí)具備多個(gè)領(lǐng)域的專(zhuān)業(yè)知識(shí)。

因此，只有產(chǎn)品經(jīng)理而沒(méi)有程序員的情況已經(jīng)很常見(jiàn)。

指南中給出的方法是使用“自我反思（self-reflection）”提示法。

我們要做的，不是上來(lái)就讓AI寫(xiě)代碼，而是先去引導(dǎo)它進(jìn)行思考。

事實(shí)上，這是符合工程思維的做法，本質(zhì)上是讓AI先進(jìn)行需求分析和架構(gòu)設(shè)計(jì)。

用戶(hù)則需要確定AI生成的方案是否與其預(yù)想類(lèi)似，并以此進(jìn)行微調(diào)或修改。

先輸出一份高質(zhì)量的設(shè)計(jì)文檔再?lài)?yán)格執(zhí)行，雖然看起來(lái)步驟有些繁瑣，但根據(jù)實(shí)際使用經(jīng)驗(yàn)來(lái)看，最終輸出的代碼的質(zhì)量和結(jié)構(gòu)性都有明顯的提升。

2.發(fā)給AI一本“程序員培訓(xùn)手冊(cè)”

適用場(chǎng)景：在現(xiàn)有項(xiàng)目中添加功能或進(jìn)行重構(gòu)

這個(gè)功能同樣應(yīng)用地相當(dāng)頻繁。

現(xiàn)實(shí)工作中，不僅是程序員的代碼，很多項(xiàng)目都需要進(jìn)行反復(fù)修改和完善。

必要時(shí)，也可能需要“刪掉重寫(xiě)”。

但是，工作交接是有風(fēng)險(xiǎn)的，新程序員和老程序員的寫(xiě)代碼風(fēng)格可能不一樣，新員工和老員工的工作方式也有所差別。

因此，給AI提供一套具體而細(xì)致的規(guī)則，才能讓AI生成的內(nèi)容無(wú)縫融入項(xiàng)目，避免風(fēng)格沖突和低級(jí)錯(cuò)誤的出現(xiàn)。

不過(guò)，從圖中也能看出來(lái)，這項(xiàng)技巧是有一定技術(shù)門(mén)檻的。

想要寫(xiě)出這種提示詞，可能需要經(jīng)驗(yàn)豐富的“老員工”提供一些技術(shù)指導(dǎo)。

3.額外的一些實(shí)戰(zhàn)經(jīng)驗(yàn)

一些用戶(hù)在使用GPT-5后發(fā)現(xiàn)，有時(shí)候它在對(duì)話中就是個(gè)話癆，有時(shí)候生成的內(nèi)容又過(guò)于簡(jiǎn)潔。

看起來(lái)很矛盾，是不是？

解決方案倒也出人意料的簡(jiǎn)單，把全局API參數(shù)verbosity設(shè)為low，讓它少說(shuō)話。

再在提示詞里寫(xiě)清楚：“請(qǐng)給出詳細(xì)、可讀性強(qiáng)的注釋”，讓它不許省略關(guān)鍵信息。

另一個(gè)需要注意的變化是，對(duì)GPT-4很有效的強(qiáng)制性提示，比如“請(qǐng)務(wù)必徹底、全面地分析上下文”，對(duì)GPT-5可能適得其反。

GPT-5天生喜歡思考和探索，而過(guò)度的強(qiáng)調(diào)可能讓它在簡(jiǎn)單的任務(wù)上來(lái)一出“大炮打蚊子”。

為了避免這種浪費(fèi)時(shí)間、浪費(fèi)資源的行為，提示詞就得更柔和、更具引導(dǎo)性一些。

通用的控制技巧

下面的技巧適用于所有類(lèi)型的任務(wù)。

1.全新的控制器：verbosity和reasoning_effort

這兩個(gè)詞其實(shí)前面我們已經(jīng)提到過(guò)了，它們很重要，不過(guò)看起來(lái)似乎有些容易混淆：

推理強(qiáng)度（reasoning_effort）：決定AI思考的有多深、多努力。

詳細(xì)度（verbosity）：決定AI最終回答的有多長(zhǎng)、多仔細(xì)。

2.GPT-5的“阿喀琉斯之踵”：指令沖突

相比以前的舊模型，GPT-5有了一個(gè)新的特點(diǎn)：較真兒。

作為一個(gè)嚴(yán)謹(jǐn)而可靠的AI助手，它會(huì)嚴(yán)格遵循用戶(hù)輸入的每一條指令。

這就帶來(lái)了一個(gè)問(wèn)題：結(jié)構(gòu)不良的提示詞（poorly-constructed prompts）對(duì)它造成的傷害容易“觸發(fā)暴擊”。

對(duì)于一般的用戶(hù)來(lái)說(shuō)，在編寫(xiě)完提示詞后肯定不會(huì)再去專(zhuān)門(mén)檢查一遍表述是否有問(wèn)題。

但若是提示詞中無(wú)意間包含了相互矛盾或者模棱兩可的指令時(shí)可就出問(wèn)題了。

GPT-5不會(huì)像舊模型一樣隨機(jī)選一個(gè)執(zhí)行，而是會(huì)嘗試去調(diào)和這些矛盾。

在這個(gè)過(guò)程中，伴隨著大量資源（時(shí)間和tokens）的消耗。

而最終的結(jié)果，很有可能就是性能下降、邏輯混亂甚至任務(wù)失敗。

OpenAI給出的示例是醫(yī)療助手的場(chǎng)景：

指令A(yù)：未經(jīng)患者明確同意，絕不安排預(yù)約。

指令B：對(duì)于高危病例，自動(dòng)分配最早的當(dāng)日時(shí)段以降低風(fēng)險(xiǎn)。

在我們看來(lái)，可能指令B更具備優(yōu)先性；但在GPT-5看來(lái)，這就是個(gè)僵持不下的死局。

而對(duì)于這個(gè)問(wèn)題，OpenAI給出的解決方案有三條：

一是審查提示詞，檢查是否存在邏輯沖突；

二是建立指令層級(jí)，明確指出在特定情況下不同規(guī)則的優(yōu)先級(jí)；

三是使用官方工具，指南中提及的prompt optimizer tool可用于幫助自動(dòng)識(shí)別這類(lèi)問(wèn)題。

前兩條解決方案，都需要用戶(hù)親自動(dòng)手，與“自動(dòng)化”需求背道而馳。

第三條解決方案，如果用戶(hù)不看這份指南，又沒(méi)有來(lái)自外部的指點(diǎn)，根本不可能知道。

錦上添花的高階玩法

最后，指南中還分享了一些“獨(dú)門(mén)秘籍”。

1.極速模式：最小化推理

這是專(zhuān)門(mén)為了低延遲場(chǎng)景而設(shè)計(jì)的一種模式。

在保留推理能力的基礎(chǔ)之上，盡可能加快了模型的運(yùn)行速度。

但這么做的代價(jià)，是模型自身的規(guī)劃能力的降低。

因此，這一模式非常看重提示詞的質(zhì)量，用戶(hù)最開(kāi)始就得主動(dòng)要求GPT-5對(duì)任務(wù)進(jìn)行規(guī)劃。

此外，用戶(hù)的指令必須足夠清晰，不能有矛盾或模棱兩可之處。

而用戶(hù)還需要強(qiáng)化“持久性提醒”，反復(fù)告知AI“要完成整個(gè)任務(wù)”或其他細(xì)節(jié)性要求。

2.元提示（Metaprompting）

這又是我們平時(shí)不太容易想到的一種與GPT-5交互的方式：

讓GPT-5教用戶(hù)如何向它提問(wèn)。

當(dāng)我們發(fā)送提示詞給GPT-5但沒(méi)得到滿(mǎn)意的結(jié)果時(shí)，不必自己費(fèi)勁修改，直接再丟給GPT-5：

以子之矛，攻子之盾。

當(dāng)然，提示詞這部分的優(yōu)化，也可以用我們先前介紹過(guò)的PromptPilot或是其他大模型完成。

寫(xiě)在最后

看完OpenAI這份被大多數(shù)人忽視的官方指南，我多少理解了一些GPT-5的差評(píng)。

相比于前代模型，GPT-5的改動(dòng)有些過(guò)大了，讓大部分AI使用者一時(shí)間難以適應(yīng)。

如果不細(xì)看OpenAI給出的這份“官方劇透”，很多資深A(yù)I玩家恐怕都束手無(wú)策。

GPT-5差評(píng)啟示錄：用戶(hù)與AI交互方式還停留在上一個(gè)時(shí)代

在這場(chǎng)風(fēng)波中，我意識(shí)到，像我這樣的普通人對(duì)于AI的了解程度，可能和人類(lèi)對(duì)于宇宙的了解程度，差別并不大：

我們的直覺(jué)是錯(cuò)的。

我們習(xí)慣性地認(rèn)為，對(duì)AI下達(dá)強(qiáng)勢(shì)而全面的指令會(huì)獲得更好的效果，但卻讓天生“想太多”的GPT-5走上低效和混亂的道路。

我們看不見(jiàn)的“開(kāi)關(guān)”太多了。

平時(shí)只是點(diǎn)開(kāi)網(wǎng)頁(yè)版GPT-5的我們，誰(shuí)能想到還有專(zhuān)門(mén)的按鈕（reasoning_effort和verbosity）來(lái)控制AI思考的“深度”和回答的“長(zhǎng)度”？

我們最大的敵人，是自己的“想當(dāng)然”。

我們自以為只要給AI發(fā)出清晰的指令就足以讓它完成任務(wù)，但卻從未意識(shí)到自己可能不經(jīng)意間給AI布置了很多邏輯陷阱。

這份指南在一定程度上揭示了與高級(jí)人工智能協(xié)作的底層邏輯。

隨著GPT-5的誕生，各大廠商早晚也會(huì)推出智能化程度更高的新模型。

當(dāng)我們面對(duì)這樣一個(gè)能力遠(yuǎn)超以往的“新物種”時(shí)，最大的障礙，并不是AI的智能上限，而是我們自身認(rèn)知和交互習(xí)慣的局限。

因此，“人與工具”的思維定式或許已經(jīng)到了需要轉(zhuǎn)變?yōu)?strong>“人與心智”的協(xié)作范式的時(shí)刻。

而GPT-5的這次差評(píng)風(fēng)波，只會(huì)是未來(lái)無(wú)數(shù)次認(rèn)知沖擊的第一次預(yù)演。

a级毛毛片_亚洲99_魔兽1～6集在线观看_黑白配在线观看_天天操日日操_四虎免费网站

GPT-5差評(píng)啟示錄：用戶(hù)與AI交互方式還停留在上一個(gè)時(shí)代

汽車(chē)評(píng)測(cè)更多>>