人工智慧也能寫心靈雞湯?GPT-3曾奪「Hacker News」科技媒體排行榜冠軍(下)
GPT-3 不只會寫文,還可從長篇大論中摘要重點 GPT-3 可高度理解原作者的撰文意圖,並有效處理;完全沒有其他早期開發的 人工智慧 模型的缺點(例如低精準度、不容易理解使用者的文字意圖⋯⋯等)。因此研究團隊就聚焦在 GPT-3 ,不斷修正與微調,持續提升 人工智慧 理解問題的精準度,因此 GPT-3 能為原本耗時或難以評估時間的任務,提供除了撰文之外,更多的應用方式。 圖片出處:CC0授權圖庫搜尋 GPT-3 新功能解鎖:將12萬字《傲慢與偏見》精煉成200字重點 OpenAI 研究人員不斷開發 GPT-3 的新應用方向。這次,他們成功將 GPT-3 微調成「抓重點」神器。原本擁有 12 萬字詞編排的《傲慢與偏見》長篇名著,被 GPT-3 精煉出總結不到 200 個字詞的小說摘要。 雖然被 人工智慧 精煉成千分之一的字句,但是原著故事內容都完整保留!其他精簡成摘要的著作還有《愛麗絲夢遊仙境》、《羅密歐與茱麗葉》、《自由之心》從生成少許的文字敘述一窺劇情全貌。 人工智慧「寫手」GPT-3 新功能解鎖:將擁有 12 萬字的《傲慢與偏見》精煉成200字重點(圖片出處: OpenAI ) GPT-3 如何生成文字? 就技術面來看,進行判斷文章長度,總結一段長文本分解成較短內容,而在這些短內容的段落中擷取重點,持續縮減字數並且串接成通順可讀內容。這樣對文章內容的分解方式,無論是數十、數百或數千頁都能夠做出總結摘要。 OpenAI 在 GPT-3 透過小說種類的書籍進行訓練模型,平均超過 100,000 個字詞數。這樣的訓練模式可更換為不同的語言、採樣方式及訓練數據類型,並且藉由強化學習以對抗生成方式,提供輕鬆閱讀文字結果。同時,在強化學習中採用三種變體抽樣訓練方式,藉此讓GPT-3確實能理解小說內容表達主軸。 在訓練過程中,研究人員選取 Goodreads 2020 榜單最受歡迎的 40 本書籍,包含奇幻、恐怖、愛情、推理等 20 多種類別,並由兩名研究人員閱讀每本書後寫出其摘要,再對比 GPT-3 生成的摘要,進行評分。最後,研究人員與 GPT-3 所...