發表文章

目前顯示的是有「生成對抗網路」標籤的文章

只需輸入文字,人工智慧替你完成一幅畫!

圖片
繪圖用 人工智慧 發展到「你說我畫」的境界!透過  NVIDIA  於上個月發表的最新版 GauGAN2( 點此繪圖 ),你只要輸入「海灘的日落」 (sunset at a beach) 等短句, 人工智慧 即可自動生成精細的日落海灘圖像!若你覺得還不夠,沒關係!你還可以進一步加入更精確的敘述句如「沿岸的日落」 (sunset at a rocky beach),或是將「夕陽」換成「下午」、「雨天」等字詞,都能讓 GauGAN2 立即調整生成圖像。 過去  NVIDIA  在 2019 年 GPU 技術大會(GTC)上,首次發表了人工智慧繪圖工具—— 「GauGAN」的第一代 ,能透過簡單的手繪草圖自動生成栩栩如生的風景圖;現在又持續更新為第二代的 GauGAN2,加入了能以簡單的描述字句,即可自動建立圖像的功能、且精細度更符合使用者所需結果:如自動形成使用者所構想海灘形式,夕陽呈現的位置等。 依據  NVIDIA  官方說明,GauGAN2 採用分割映射(segmentation mapping)、圖像修復以及文字轉圖像生成功能,能依據文字敘述或手繪生成高品質的精細圖像之外;也是第一個在單一對抗生成網路(Generative Adversarial Network,GAN)運算中,加入文字語意識別,讓藝術創作者能以更簡單的方式,指引 人工智慧 快速生成圖像。 使用者不需畫出心中場景的每個元素,只需輸入短句, 人工智慧 技術就能依照短語,快速生成關鍵特徵和主題:如被白雪覆蓋的山脈;接著,使用者特於特定的山上草草點個幾筆,讓那座山更高;最後還可在前方加入幾棵樹、或天空增加幾朵雲來點綴整副畫作。簡單幾個動作,藝術家就能描繪出栩栩如生的美景圖、或是超現實的蒸氣龐克風格繪畫。 NVIDIA  強調,GauGAN2 背後運算則採用了 NVIDIA Selene 超級電腦運算系統,已經使用 1 千萬張高品質風景圖片訓練 GauGAN2  人工智慧 模型,並讓系統能將描述字詞與風景圖像建立關連,以能快速對應到使用者輸入字詞後產生相應圖像。 透過人工智能,GauGAN2 讓藝術家們的作畫工具變得更強大多元、且作畫速度變得更有效率、更開啟了藝術創作的無限可能性。 GauGAN2 傳送門在此,點我來作畫吧! ...

疫情期間線上會議不可少,就讓這AI視訊會議神器罩你!(下)

圖片
第三個關於 AI 視訊會議神器的好處-"眼神接觸、臉部對齊"??這是什麼意思?   眼神接觸、臉部對齊……   AI 人工智慧提升視訊會議的體驗 臉部眼神校正功能:模擬面對面開會 Maxine 還應用了  NVIDIA  在生成對抗網路 (GAN) 的優勢,讓視訊會議服務供應商能為用戶提供各種 AI 功能,讓用戶有真實「面對面」的感受。 例如:「臉部對齊」功能可自動調整臉部角度,讓用戶在參與會議的過程中,看起來像是彼此相對、「眼神校正」能模擬眼神接觸、校正會議參與者的視線。這些功能能幫助與會者保持互動,無需一直盯著攝影機。 「臉部對齊」功能可自動調整臉部角度,讓用戶在參與會議的過程中,看起來像是彼此相對。 替身與虛擬背景:人再邋遢、家中再亂都能體面開會! 除此之外,視訊會議服務的供應商也能增加替身功能,讓用戶選擇自己的動畫當替身,能即時地透過用戶的聲音、情緒音調,自動生成逼真的動畫。 除了替身功能,Nvidia 也在今年六月 CVPR 大會,發表 Maxine 平台最新的「Vid2Vid Cameo」的深度學習模型:採用生成對抗網絡(GAN)的技術,只需將一個人的 2D 照片合成至談話影像中,就能輕易地打造數位虛擬化身、節省視訊頻寬,並能夠進行人臉辨識等強大功能。如此一來,就算鏡頭另一端的用戶衣衫不整、頭髮凌亂也不怕了!只要你在會議前拿出一張自己穿正式衣服的照片,就能讓穿著得體的自己當成替身參與視訊會議喔! 假如家中小孩太吵、或是燈光太暗的話,也不用怕!Maxine 的 AI 人工智慧 技術可以移除背景噪音、並且提供超高解析度的畫面,也提升光線較暗時的清晰度,甚至為臉重新打光! 有了參與會議時,若家中小孩太吵也不用擔心,因為 Maxine 的人工智慧技術可以移除背景噪音! 若上述的都不行的話,你也可以乾脆直接更換成虛擬背景! 若家中真的有見不得人的場景的話,試試 Maxine 的虛擬背景吧! Jarvis 對話式 AI:即時翻譯、會議記錄 透過 NVIDIA 對話式 人工智慧 功能 Jarvis SDK,開發人員可藉由整合使用虛擬助手,在視訊會議服務中進行語音辨識、語言理解與語音生成的功能。虛擬助手可做紀錄、...

疫情期間線上會議不可少,就讓這AI視訊會議神器罩你!(上)

圖片
你聽說過 AI 會議神器Maxine了嗎?讓我們一起來看看它的實用性~     目錄 無需強大硬體,即可享有高解析.無噪音的視訊會議體驗 AI 捕捉臉部關鍵點,所需頻寬減至原本一成 眼神接觸、臉部對齊……人工智慧提升視訊會議的體驗 臉部眼神校正功能:模擬面對面開會 替身與虛擬背景:人再邋遢、家中再亂都能體面開會! Jarvis 對話式 AI:即時翻譯、會議記錄 疫情期間,WFH 已成常態,全球有數百萬人使用視訊來開會、學習、娛樂,甚至就診。IT 大廠紛紛發展視訊會議能應用的 人工智慧 技術。 微軟甚至聯合美妝大廠資生堂,共同推出能「立即上妝」的視訊會議 AI 技術呢 ! 而顯示卡大廠 NVIDIA 去年末推出的雲端視訊串流 AI 平台「Maxine」,能使用 人工智慧 視訊壓縮技術—只要從人臉上「抓到」幾個關鍵點後,就能在另一端依據這些臉部特徵關鍵點 (facial points),重建人臉動畫。如此一來,就不需串流整個影像的畫素,大幅度降低視訊傳輸所需的頻寬。 以下影片為 NVIDIA Maxine 的各種功能介紹: 無需強大硬體,即可享有高解析.無噪音的視訊會議體驗 NVIDIA Maxine 是雲端原生的視訊串流 AI 平台,其嶄新的 AI 功能可被導入到各式各樣的網路視訊會議中。視訊會議的服務供應商可透過 NVIDIA 的雲端 GPU(沒錯!此款 GPU 真的就在雲端上,因此你無需添購任何專業的設備~)上運行該平台,為用戶提供全新的 AI 功能,包括視線校正(Gaze Correction)、超高解析度、噪音消除和臉部打光等功能。 由於資料是在雲端而不是在本地設備上處理,因此使用者無需任何強大的硬體設備,即可享受高解析度、無背景噪音、自動修正的角度、甚至虛擬背景、替身、即時翻譯等進階功能! AI 捕捉臉部關鍵點,所需頻寬減至原本一成 以下為 NVIDIA Research AI 視訊壓縮展示影片: NVIDIA 使用的 人工智慧 技術可以分析每個會議參與者的臉部關鍵點(眼、鼻、口等周圍的要點 key points),並在接收器端運用所抓到的臉部要點來重建臉部動畫。如此一來就不需要傳輸完整的畫面,傳輸的資料減少了,所...

這人工智慧軟體把你的草圖變成幾可亂真的風景照~

圖片
人工智慧 面對你的草圖可一點都不驚慌,它三兩下就能把草圖變為超真實的美麗風景照呢!       Nvidia 非常擅長將 人工智慧 技術用於創造擬真的圖像,像是之前的 StyleGEN 就可以合成幾可亂真的虛擬人臉(雖然合成貓咪有點失敗) 。去年他們又出了一款 AI 工具「 GauGAN 」可將信手捻來的線搞草圖,化為擬真的風景圖。 該軟體使用一種被稱為「生成對抗網絡(GAN)」的 人工智慧 模型,提供一種被 Nvidia 稱為「智能畫筆(smart paint brush)」的工具。 這意味著用戶只需繪製基本的線條輪廓,軟體可以自動以自然紋理(例如草,雲,森林或岩石)填充,最後一個擬真的自然風景就這樣呼之欲出了! 雖然 Nvidia 的「GauGAN」並非是此類 AI 軟體的創舉,但是生成的效果讓人讚為觀止——該人工智慧軟體可讓用戶以極其直觀的方式,生成幾可亂真的景觀。例如,當用戶隨性繪製一棵樹,然後在其下繪製水池時,AI 模型還可將樹的倒影添加到水池中呢! 儘管 Nvidia 提供的 demo 看起來很強大,但是 GauGAN 仍有他的限制。因為生成草地、水等自然物質所涉及的視覺模式是非結構化的。相比之下,生成建築物和家具的圖片要復雜得多,而且結果也差強人意——那是因為這些物體涉及到人類敏銳的邏輯和結構。正如之前我們所看到的 Nvidia 人工智慧 生成人臉,雖然 GAN 可說是表現的有模有樣,但這也是拜大量的額外工作所賜。 而 Nvidia 也未透露是否有任何讓該軟件商品化的計畫,但暗示這樣的工具將來可以幫助「建築師、城市規劃師、園藝設計師和遊戲開發商的從業人員」。 NVIDIA 應用深度學習研究部門副總裁 Bryan Catanzaro 表示:「使用簡單的草圖來集思廣益做設計,是要容易得多了!並且該技術能將草圖轉換為高擬真的圖像。」           延伸閱讀: 人工智慧也即將取代法官了?讓我來看看愛沙尼亞的新政策!(下) 人工智慧貓窩,可不是只是空殼,來看看它的功能!(下) 人工智慧開始生產文章!而且還是雞湯文!?(上) 【人工智慧預防糖尿病患失明】台大打造...