🐱口滋A打油🐱
@scarfman
說
Mon, Dec 18, 2023 2:09 PM
Mon, Dec 18, 2023 2:12 PM
2
Intl Econ Observe (@IEObserve) on X
『OpenAI 官方的Prompt指南,如果你不會對AI下指示得到你想要的結果,應該直接從官方教你的策略開始下手,其實寫得很詳細還有舉例。』
https://platform.openai.com/...
OpenAI
🐱口滋A打油🐱
@scarfman
說
Mon, Dec 18, 2023 2:10 PM
Mon, Dec 18, 2023 2:11 PM
『
寫下清晰的指示
這些模型無法讀懂你的想法。如果輸出太長,請要求簡短答案。如果輸出太簡單,請要求專家級的寫作。如果您不喜歡這種格式,請示範您希望看到的格式。模型猜測你想要什麼的次數越少,你得到它的可能性就越大。』
🐱口滋A打油🐱
@scarfman
說
Mon, Dec 18, 2023 2:10 PM
『
提供參考文字
語言模型可以自信地發明假答案,特別是當被問及深奧的主題或引文和 URL 時。就像一張筆記可以幫助學生在考試中取得更好的成績一樣,為這些模型提供參考文本可以幫助減少作答次數。』
🐱口滋A打油🐱
@scarfman
說
Mon, Dec 18, 2023 2:10 PM
『
將複雜的任務拆分為更簡單的子任務
正如軟體工程中將複雜系統分解為一組模組化元件是良好實踐一樣,提交給語言模型的任務也是如此。複雜的任務往往比簡單的任務有更高的錯誤率。此外,複雜的任務通常可以被重新定義為更簡單任務的工作流程,其中早期任務的輸出用於建構後續任務的輸入。』
🐱口滋A打油🐱
@scarfman
說
Mon, Dec 18, 2023 2:10 PM
Mon, Dec 18, 2023 2:11 PM
『
給模型時間“思考”
如果要求將 17 乘以 28,您可能不會立即知道,但隨著時間的推移仍然可以計算出來。同樣,模型在嘗試立即回答而不是花時間找出答案時會犯更多推理錯誤。尋求“思想鏈”在答案可以幫助模型更可靠地推理出正確答案之前。』
🐱口滋A打油🐱
@scarfman
說
Mon, Dec 18, 2023 2:11 PM
『
使用外部工具
透過向模型提供其他工具的輸出來彌補模型的弱點。例如,文字檢索系統(有時稱為 RAG 或檢索增強生成)可以告訴模型相關文件。像 OpenAI 的程式碼解釋器這樣的程式碼執行引擎可以幫助模型進行數學計算並運行程式碼。如果一項任務可以透過工具而不是語言模型更可靠或更有效地完成,那麼可以卸載它以充分利用兩者。』
🐱口滋A打油🐱
@scarfman
說
Mon, Dec 18, 2023 2:11 PM
『
有系統地測試變更
如果您可以衡量效能,那麼提高效能就會更容易。在某些情況下,對提示的修改將在一些孤立的範例上實現更好的效能,但會導致在一組更具代表性的範例上整體效能變差。因此,為了確保變更對效能有淨正面作用,可能有必要定義全面的測試套件(也稱為「評估」)。』
載入新的回覆
https://platform.openai.com/...
OpenAI
這些模型無法讀懂你的想法。如果輸出太長,請要求簡短答案。如果輸出太簡單,請要求專家級的寫作。如果您不喜歡這種格式,請示範您希望看到的格式。模型猜測你想要什麼的次數越少,你得到它的可能性就越大。』
語言模型可以自信地發明假答案,特別是當被問及深奧的主題或引文和 URL 時。就像一張筆記可以幫助學生在考試中取得更好的成績一樣,為這些模型提供參考文本可以幫助減少作答次數。』
正如軟體工程中將複雜系統分解為一組模組化元件是良好實踐一樣,提交給語言模型的任務也是如此。複雜的任務往往比簡單的任務有更高的錯誤率。此外,複雜的任務通常可以被重新定義為更簡單任務的工作流程,其中早期任務的輸出用於建構後續任務的輸入。』
如果要求將 17 乘以 28,您可能不會立即知道,但隨著時間的推移仍然可以計算出來。同樣,模型在嘗試立即回答而不是花時間找出答案時會犯更多推理錯誤。尋求“思想鏈”在答案可以幫助模型更可靠地推理出正確答案之前。』
透過向模型提供其他工具的輸出來彌補模型的弱點。例如,文字檢索系統(有時稱為 RAG 或檢索增強生成)可以告訴模型相關文件。像 OpenAI 的程式碼解釋器這樣的程式碼執行引擎可以幫助模型進行數學計算並運行程式碼。如果一項任務可以透過工具而不是語言模型更可靠或更有效地完成,那麼可以卸載它以充分利用兩者。』
如果您可以衡量效能,那麼提高效能就會更容易。在某些情況下,對提示的修改將在一些孤立的範例上實現更好的效能,但會導致在一組更具代表性的範例上整體效能變差。因此,為了確保變更對效能有淨正面作用,可能有必要定義全面的測試套件(也稱為「評估」)。』