訓練AI人工智慧的教材哪裡找?什麼?我們就能提供了!?
臉書想到一個訓練AI人工智慧的好方法!只要我們在照片加上tag,就可以幫臉書免費訓練AI..!
身為 AI 人工智慧的領導廠商之一,FB 有大量讓 AI 做機器學習的資料庫。這些訓練 AI 的「教材」包含數十億的 IG 相片 ── 沒錯,也包含你在 IG 上傳的照片。
2012 年,Facebook 花 10 億美元收購當時擁有 3 千萬使用者的 Instagram。6 年後的今天,現在的 IG 平均每月都有超過 8 億的活躍使用者。
目前有超過 35 億張用戶貼在 IG 上的圖片,被 FB 拿來做 人工智慧 學習「如何自行分類圖片」的演算法教材。這個演算法也牽涉到超過 17000 個被拿來標註照片的 Hashtag (主題標籤)。
Facebook : 我們破天荒用 35 億張圖片來訓練AI
Facebook 的首席技術長 Mike 日前在F8上表示:FB 使用 35 億張已被標註過的圖片來訓練AI ── 在不浪費人力的狀況下。
|
Facebook 的首席技術長 Mike Schroepfer 日前在一年一度的 F8 2018 Facebook 開發者大會上表示:
「會限制電腦視覺領域以及 AI 人工智慧領域發展的主要因素,是因為我們幾乎都倚賴人力標註、人為操作而得來的資料庫(來訓練)。
但要是人們不標註圖片上的指定事物,則就算是最先進的電腦,也無法在運作的時候,辨別這些事物,因為它從未在訓練時看過這些東西。因此我們創造了突破性的技術 ── 大規模地取用「可公開的」並已經有 Hashtag 標註的照片。目前已有 35 億張圖片來用做訓練 ── 在這組公開的圖片庫中,完全沒有任何的人力行為。(這裡指人工標註等行為,詳情請參考這篇「訓練百度AI的老師們薪水多少? 答案讓你跌破眼鏡 」)。」
海量圖片.高準確度,打破 IBM 的紀錄
這組圖片庫規模龐大,超過了 Google 訓練 AI 演算法的圖片庫,高達十倍以上。Facebook 的工程師總監 Srinivas Narayanan 說:「我們已經創造了全球最棒的電腦視覺系統,它的準確率在 ImageNet 上達到 84.5%。」(註: ImageNet 是一套廣泛被用於「基準化分析法」的資料庫)
值得一提的是,2017 年八月美國 人工智慧為主的媒體「AI News」報導 IBM 的人工智慧 ,其電腦視覺辨識準確度高達 33.8%。且訓練的圖片也只有 750 萬張,遠低於這是 Facebook 所創造的紀錄 - 35 億張圖片、84.5% 的準確度。
延伸閱讀: