布萊恩的創業小窩

發表文章

目前顯示的是有「生成對抗網路」標籤的文章

只需輸入文字，人工智慧替你完成一幅畫！

- 12月 27, 2021

繪圖用人工智慧發展到「你說我畫」的境界！透過 NVIDIA 於上個月發表的最新版 GauGAN2（點此繪圖），你只要輸入「海灘的日落」 (sunset at a beach) 等短句，人工智慧即可自動生成精細的日落海灘圖像！若你覺得還不夠，沒關係！你還可以進一步加入更精確的敘述句如「沿岸的日落」 (sunset at a rocky beach)，或是將「夕陽」換成「下午」、「雨天」等字詞，都能讓 GauGAN2 立即調整生成圖像。過去 NVIDIA 在 2019 年 GPU 技術大會（GTC）上，首次發表了人工智慧繪圖工具—— 「GauGAN」的第一代，能透過簡單的手繪草圖自動生成栩栩如生的風景圖；現在又持續更新為第二代的 GauGAN2，加入了能以簡單的描述字句，即可自動建立圖像的功能、且精細度更符合使用者所需結果：如自動形成使用者所構想海灘形式，夕陽呈現的位置等。依據 NVIDIA 官方說明，GauGAN2 採用分割映射（segmentation mapping）、圖像修復以及文字轉圖像生成功能，能依據文字敘述或手繪生成高品質的精細圖像之外；也是第一個在單一對抗生成網路（Generative Adversarial Network，GAN）運算中，加入文字語意識別，讓藝術創作者能以更簡單的方式，指引人工智慧快速生成圖像。使用者不需畫出心中場景的每個元素，只需輸入短句，人工智慧技術就能依照短語，快速生成關鍵特徵和主題：如被白雪覆蓋的山脈；接著，使用者特於特定的山上草草點個幾筆，讓那座山更高；最後還可在前方加入幾棵樹、或天空增加幾朵雲來點綴整副畫作。簡單幾個動作，藝術家就能描繪出栩栩如生的美景圖、或是超現實的蒸氣龐克風格繪畫。 NVIDIA 強調，GauGAN2 背後運算則採用了 NVIDIA Selene 超級電腦運算系統，已經使用 1 千萬張高品質風景圖片訓練 GauGAN2 人工智慧模型，並讓系統能將描述字詞與風景圖像建立關連，以能快速對應到使用者輸入字詞後產生相應圖像。透過人工智能，GauGAN2 讓藝術家們的作畫工具變得更強大多元、且作畫速度變得更有效率、更開啟了藝術創作的無限可能性。 GauGAN2 傳送門在此，點我來作畫吧！ ...

閱讀完整內容

疫情期間線上會議不可少,就讓這AI視訊會議神器罩你!(下)

- 7月 02, 2021

第三個關於 AI 視訊會議神器的好處-"眼神接觸、臉部對齊"??這是什麼意思? 眼神接觸、臉部對齊…… AI 人工智慧提升視訊會議的體驗臉部眼神校正功能：模擬面對面開會 Maxine 還應用了 NVIDIA 在生成對抗網路 (GAN) 的優勢，讓視訊會議服務供應商能為用戶提供各種 AI 功能，讓用戶有真實「面對面」的感受。例如：「臉部對齊」功能可自動調整臉部角度，讓用戶在參與會議的過程中，看起來像是彼此相對、「眼神校正」能模擬眼神接觸、校正會議參與者的視線。這些功能能幫助與會者保持互動，無需一直盯著攝影機。「臉部對齊」功能可自動調整臉部角度，讓用戶在參與會議的過程中，看起來像是彼此相對。替身與虛擬背景：人再邋遢、家中再亂都能體面開會！除此之外，視訊會議服務的供應商也能增加替身功能，讓用戶選擇自己的動畫當替身，能即時地透過用戶的聲音、情緒音調，自動生成逼真的動畫。除了替身功能，Nvidia 也在今年六月 CVPR 大會，發表 Maxine 平台最新的「Vid2Vid Cameo」的深度學習模型：採用生成對抗網絡（GAN）的技術，只需將一個人的 2D 照片合成至談話影像中，就能輕易地打造數位虛擬化身、節省視訊頻寬，並能夠進行人臉辨識等強大功能。如此一來，就算鏡頭另一端的用戶衣衫不整、頭髮凌亂也不怕了！只要你在會議前拿出一張自己穿正式衣服的照片，就能讓穿著得體的自己當成替身參與視訊會議喔！假如家中小孩太吵、或是燈光太暗的話，也不用怕！Maxine 的 AI 人工智慧技術可以移除背景噪音、並且提供超高解析度的畫面，也提升光線較暗時的清晰度，甚至為臉重新打光！有了參與會議時，若家中小孩太吵也不用擔心，因為 Maxine 的人工智慧技術可以移除背景噪音！若上述的都不行的話，你也可以乾脆直接更換成虛擬背景！若家中真的有見不得人的場景的話，試試 Maxine 的虛擬背景吧！ Jarvis 對話式 AI：即時翻譯、會議記錄透過 NVIDIA 對話式人工智慧功能 Jarvis SDK，開發人員可藉由整合使用虛擬助手，在視訊會議服務中進行語音辨識、語言理解與語音生成的功能。虛擬助手可做紀錄、...

閱讀完整內容

疫情期間線上會議不可少,就讓這AI視訊會議神器罩你!(上)

- 6月 28, 2021

你聽說過 AI 會議神器Maxine了嗎?讓我們一起來看看它的實用性~ 目錄無需強大硬體，即可享有高解析．無噪音的視訊會議體驗 AI 捕捉臉部關鍵點，所需頻寬減至原本一成眼神接觸、臉部對齊……人工智慧提升視訊會議的體驗臉部眼神校正功能：模擬面對面開會替身與虛擬背景：人再邋遢、家中再亂都能體面開會！ Jarvis 對話式 AI：即時翻譯、會議記錄疫情期間，WFH 已成常態，全球有數百萬人使用視訊來開會、學習、娛樂，甚至就診。IT 大廠紛紛發展視訊會議能應用的人工智慧技術。微軟甚至聯合美妝大廠資生堂，共同推出能「立即上妝」的視訊會議 AI 技術呢！而顯示卡大廠 NVIDIA 去年末推出的雲端視訊串流 AI 平台「Maxine」，能使用人工智慧視訊壓縮技術—只要從人臉上「抓到」幾個關鍵點後，就能在另一端依據這些臉部特徵關鍵點 (facial points)，重建人臉動畫。如此一來，就不需串流整個影像的畫素，大幅度降低視訊傳輸所需的頻寬。以下影片為 NVIDIA Maxine 的各種功能介紹：無需強大硬體，即可享有高解析．無噪音的視訊會議體驗 NVIDIA Maxine 是雲端原生的視訊串流 AI 平台，其嶄新的 AI 功能可被導入到各式各樣的網路視訊會議中。視訊會議的服務供應商可透過 NVIDIA 的雲端 GPU（沒錯！此款 GPU 真的就在雲端上，因此你無需添購任何專業的設備～）上運行該平台，為用戶提供全新的 AI 功能，包括視線校正（Gaze Correction）、超高解析度、噪音消除和臉部打光等功能。由於資料是在雲端而不是在本地設備上處理，因此使用者無需任何強大的硬體設備，即可享受高解析度、無背景噪音、自動修正的角度、甚至虛擬背景、替身、即時翻譯等進階功能！ AI 捕捉臉部關鍵點，所需頻寬減至原本一成以下為 NVIDIA Research AI 視訊壓縮展示影片： NVIDIA 使用的人工智慧技術可以分析每個會議參與者的臉部關鍵點（眼、鼻、口等周圍的要點 key points），並在接收器端運用所抓到的臉部要點來重建臉部動畫。如此一來就不需要傳輸完整的畫面，傳輸的資料減少了，所...

閱讀完整內容

這人工智慧軟體把你的草圖變成幾可亂真的風景照~

- 11月 23, 2020

人工智慧面對你的草圖可一點都不驚慌,它三兩下就能把草圖變為超真實的美麗風景照呢! Nvidia 非常擅長將人工智慧技術用於創造擬真的圖像，像是之前的 StyleGEN 就可以合成幾可亂真的虛擬人臉（雖然合成貓咪有點失敗）。去年他們又出了一款 AI 工具「 GauGAN 」可將信手捻來的線搞草圖，化為擬真的風景圖。該軟體使用一種被稱為「生成對抗網絡（GAN）」的人工智慧模型，提供一種被 Nvidia 稱為「智能畫筆（smart paint brush）」的工具。這意味著用戶只需繪製基本的線條輪廓，軟體可以自動以自然紋理（例如草，雲，森林或岩石）填充，最後一個擬真的自然風景就這樣呼之欲出了！雖然 Nvidia 的「GauGAN」並非是此類 AI 軟體的創舉，但是生成的效果讓人讚為觀止——該人工智慧軟體可讓用戶以極其直觀的方式，生成幾可亂真的景觀。例如，當用戶隨性繪製一棵樹，然後在其下繪製水池時，AI 模型還可將樹的倒影添加到水池中呢！儘管 Nvidia 提供的 demo 看起來很強大，但是 GauGAN 仍有他的限制。因為生成草地、水等自然物質所涉及的視覺模式是非結構化的。相比之下，生成建築物和家具的圖片要復雜得多，而且結果也差強人意——那是因為這些物體涉及到人類敏銳的邏輯和結構。正如之前我們所看到的 Nvidia 人工智慧生成人臉，雖然 GAN 可說是表現的有模有樣，但這也是拜大量的額外工作所賜。而 Nvidia 也未透露是否有任何讓該軟件商品化的計畫，但暗示這樣的工具將來可以幫助「建築師、城市規劃師、園藝設計師和遊戲開發商的從業人員」。 NVIDIA 應用深度學習研究部門副總裁 Bryan Catanzaro 表示：「使用簡單的草圖來集思廣益做設計，是要容易得多了！並且該技術能將草圖轉換為高擬真的圖像。」延伸閱讀：人工智慧也即將取代法官了?讓我來看看愛沙尼亞的新政策!(下) 人工智慧貓窩,可不是只是空殼,來看看它的功能!(下) 人工智慧開始生產文章!而且還是雞湯文!?(上) 【人工智慧預防糖尿病患失明】台大打造...

閱讀完整內容