sixwings
mur 嘗試整理跟 AI 對談的所有紀錄,發現比想像中得難
sixwings
chatGPT 首次發布時間為 2022-11-30 到現在累積大概三年的交談量,匯出檔案容量大約 160 MB,容量佔比最大的是 chat.html, conversations.json 這兩個。

由於他給的檔案以目前的編輯器幾乎都沒辦法開,後續勢必要開發額外的解析工具處理。要提煉出新的資訊還需要克服一些問題
sixwings
早期有人解析交談紀錄的結構,在 chatGPT 官方提供匯出紀錄之前就寫了自訂腳本完成匯出功能了。但交談數量達到千、萬級別的時候,組織這些資訊就變成很重要的課題

不然就是無止盡地生成,完全放棄整理
sixwings
另一條方式是分享公開網址,透過連結的形式管理。

這可能是現在相對好的做法,保存的資訊相對完整 (html),比匯出資料的純文字格式 (markdown) 好一些
sixwings
現階段不會下去處理這些事情,想要先減緩資料累積的速度。但真正目標其實是從過往交談紀錄中提取出更有價值的東西

後續方向是「整理、組織、便於存取」,但以人類的惰性來說,能夠通通丟給 AI 整理就算了,不會是吸引人的題材
載入新的回覆