打造「聊」癒系機器人!看圖說故事 AI也略懂略懂
信傳媒
研之有物
2020年11月8日 下午1:24
看圖說故事對人類來說,是輕鬆好玩的事,但對 AI 來說,卻是巨大挑戰,因為這代表 AI 必須看出圖中有哪些物件、理解圖片意義、能夠生成文句,還要看懂圖片間的因果邏輯。在中研院資訊科學研究所古倫維副研究員的努力下, AI 看圖說故事的能力有了很大的進展。她的模型有什麼獨特之處呢?跟著研之有物一起來瞧瞧!
俗話說得好:「發文不附圖,此風不可長。」不論你發的是爆卦文、閒聊文還是業配文,有圖更容易晉身流量熱文。不過近年來,社群網站發文的風向漸漸有了改變,從「發文附圖」轉變成「發圖附文」,我們總是先來一張照片,再配上相應的描述文字。接下來,我們的發文習慣還會怎麼改變?
或許,未來你拍下一張照片上傳社群網站,電腦就會自動「看圖說故事」,為你的照片腦補一段說明文字,節省你的思考時間。
讓電腦學會「看圖說故事」的伎倆,正是中研院資訊科學研究所的古倫維副研究員正在鑽研的主題之一。她的主要研究領域是人工智慧( AI )的自然語言處理,在因緣際會下,接觸到一個 AI 看圖說故事的競賽: Visual Storytelling ( VIST ),開啟了她對 AI 看圖說故事的興趣。
電腦如何學會「看圖說故事」?目前學界使用「機器學習」,簡單來說,就是讓電腦從大量的圖文搭配組合,從中學習看到怎樣的圖片,應該說出怎樣的故事。古倫維說:「其實一開始我們做得並不特別好。我們跟其他參加競賽的人一樣,用機器學習的方法,把圖和對應的文字丟進電腦,讓機器自己學習最佳的圖文搭配。然而機器學習幾乎是軍備競賽了!誰的電腦計算能力更強,得到的模型更複雜,生成的文字就會更好。」
先選角、打草稿,再寫故事
在軍備競爭不足的情況下,古倫維決定採取不同的策略:「既然完全由 AI 看圖說故事的效果不夠好,能不能在故事生成的過程中,有一個人類可以介入改善的步驟。」所以她把原來的做法分成了兩個階段,先從圖片抽取語意,接著再生成文字故事。
語意抽取,是指先從個別圖片中選出用來說故事的概念(如同電影選角),用知識庫找出概念之間的關係,建立圖片的關聯,再為這些圖片擬定最好的草稿(如同電影故事大綱)。
重點來了!在「選角」階段, AI 會先以機器學習的結果,找出最適合說故事的「角色組合」,尤其是面對連續圖片。這就好比張曼玉、梁朝偉、成龍三個演員,前兩個主要演愛情片,第三個以武打戲為主,如果第一張照片選了張曼玉,第二張照片應該選梁朝偉,生成的故事會比較好看。
但目前 AI 選角部分還不夠靈光,有時仍會發生如「張曼玉配成龍」的選角名單。古倫維的兩階段設計讓人類可在「選角」階段介入修改。實際例子如:圖片中有小男孩、天空、腳踏車三個概念。AI 從上圖抽取出的概念可能是「小男孩」、「天空」,最後生成的故事可能是「一個小男孩在天空下」……滿無聊的。但人類可以把「天空」改成「腳踏車」,機器最後就可能生成「一個小男孩騎著腳踏車。」嗯,是不是比較有故事性了?
最後,人類再將修改後的選角和故事大綱,交給 AI 產生整個故事。這種「先選角、打草稿,再說故事」的方式,最後產生的故事比較不會無聊或是不合理,更接近人類說出的故事。
知識庫,AI 想像力的補充包
為了增加 AI 的想像力,古倫維也在模型中納入「知識庫」,幫 AI 增加故事的知識。例如圖片中有人與馬,如果沒有知識庫,AI 可能只能生成「有一個人與一匹馬」這種平淡的句子。但知識庫可以補充人與馬關聯的知識,包括人可以騎馬、養馬等等,讓 AI 有機會說出「有一個人騎著自己養的馬」比較具故事性的句子。「當然 AI 也可能從大量的故事中以機器學習取得『很多人都會騎馬、養馬』的知識。但知識庫的最大功用,就是直接提供這個知識給 AI ,縮短學習歷程。」 古倫維解釋。
更重要的是,知識庫讓 AI 更容易解讀出圖片之間的關聯。如 VIST 競賽的題目就是包含了五張圖片的圖組,在知識庫的協助下, AI 比較容易找出各別圖片的概念之間的關聯,說出的故事會比較連貫,具有因果關係。
AI 是完全沒有想像力的,但若透過知識庫給它知識,這些知識在故事中呈現出來的,就像是 AI 的想像力。
巧妙切開「語意抽取」與「生成文本」
兩階段生成故事的方法還有一個優點,就是可善用大量的「圖片辨識」與「故事文本」資料庫,避開「圖文搭配」資料的缺乏。
現今的「圖片辨識」技術和資料庫非常成熟,可以精準的從圖片中抽取出各式各樣的概念。另一方面,說故事是人類從古至今不斷從事的活動,留下了大量的「故事文本」。相較之下,看圖說故事的「圖文搭配」資料量卻相當少,需要有人刻意去蒐集圖組、撰寫文字,古倫維說:「這種圖文搭配的資料必須人工建立,能有一萬組就很厲害了,但這個數量對於機器學習來說卻是遠遠不夠的。」
古倫維則把生成故事的過程拆成「語意抽取」與「生成文本」兩個階段,第一階段可利用精熟的圖片辨識技術和資料庫,抽取故事概念;第二階段再運用故事文本資料庫,讓機器學習如何將第一階段抽取(並由人類修改過)的概念,組合成漂亮的故事,巧妙避開了「圖文搭配」資料不足的難題。
把「語意抽取」與「生成文本」切開的話,兩個階段都可以利用幾千萬筆的既有資料,供機器學習。
腦補,讓機器更有溫度
說了半天,但 AI 會看圖說故事,到底能幹嘛?難道只是幫貼圖寫寫圖說?以研究的層面來說,如果 AI 能看圖說故事,代表 AI 在理解圖片、文字分析及因果邏輯等方面,都達到一定的水準,代表 AI 語言能力更加接近人類。在實際應用上, 可以為圖文創作者提供故事草稿,或是對於常常需要撰寫廣告文案、出差報告的人,能夠很快從圖像生成文本,人類只要略做修改潤飾即可 (小職員計畫通!)。
但更重要的是,機器人也能因此更有溫度!古倫維與臺大人工智慧與機器人研究中心的傅立成教授合作,希望透過 AI 看圖說故事的技術,讓居家照護機器人更有「人味」,會主動關懷人類。因為居家照護機器人在家中「看見」的一切,其實就是一張張的圖, AI 可以透過這些「圖」形成可能的故事,再轉化為暖心的問句。
想像一下,未來居家照護機器人看見老人家在廚房,故事劇情可能是「他要煮飯」,於是問出:「今晚想吃什麼?需要幫忙嗎?」當老人拿出相簿緬懷過去,AI 也能從舊照片解讀可能故事,轉化成聊天的問句:「照片中的這個人是誰啊?你們去哪裡玩?」還能變身孩子最愛的說故事姊姊!AI 可能從儲存的繪本資料庫中,隨機抽出不同圖畫重新組合,說出全新的故事。
會看圖說故事的 AI ,可以從眼前的情景連結到事件或情感,就像人類的腦補一般,而這些腦補就是故事。
如此一來,居家照護機器人不再只是被動的處理人類需求,相反的,「說故事的能力賦予了 AI 機器人找話題的功能。」古倫維笑著解釋,機器人從此不再詞窮,可以主動關心人類,與人類互動聊天,讓機器人變得溫暖許多。看來 AI 看圖說故事,不只是寫寫圖說、幫忙解決麻煩的出差報告,在不遠的未來,更是拉近我們與機器人距離的關鍵所在呢。
附圖:AI 看圖說故事的能力,可讓照顧居家照護機器人了解眼前的生活情境,具有找話題的能力,變得溫暖許多。(圖片來源/研之有物授權使用,下同)
中研院資訊科學研究所的古倫維副研究員,主要研究領域是人工智慧( AI )的自然語言處理,現正開發如何讓 AI 不只會說故事,還會看圖說故事。
古倫維的故事生成模型將產生故事的過程分成「語意抽取」及「故事生成」兩個階段。 圖說重製│黃曉君、林洵安
電腦看圖說故事的範例。No KG 代表機器在不添加額外知識時所產生的故事,Visual Genome 與 Open IE 古倫維團隊用兩個不同的知識庫分別產生的故事,GLAC 是除了古倫維的模型外目前成果最好的模型。由上可知,知識庫的確能幫助故事的上下文連結。最後的 Human 是真人所寫的故事,包含了許多圖片中沒有的知識,甚至精神性的內容。
資料來源:https://tw.news.yahoo.com/%E6%89%93%E9%80%A0-%E8%81%8A-%E7%99%92%E7%B3%BB%E6%A9%9F%E5%99%A8%E4%BA%BA-%E7%9C%8B%E5%9C%96%E8%AA%AA%E6%95%85%E4%BA%8B-ai%E4%B9%9F%E7%95%A5%E6%87%82%E7%95%A5%E6%87%82-052415130.html
同時也有38部Youtube影片,追蹤數超過3萬的網紅Yiling Chang 以琳老師,也在其Youtube影片中提到,多益閱讀別再用解題技巧了!☝️ 這次老師也燃燒靈魂製作的課程 #多益閱讀速度修煉課 https://shop.wordup.com.tw/347 多益為什麼要改制? 因為如果能用解題技巧就拿高分,那測驗的可信度就會下降 所以多益改制後,全力防堵解題技巧 如果你不能真正看懂英文句子,你就會被錯誤選項誤...
「拆成語」的推薦目錄:
拆成語 在 Yiling Chang 以琳老師 Youtube 的最佳解答
多益閱讀別再用解題技巧了!☝️
這次老師也燃燒靈魂製作的課程 #多益閱讀速度修煉課
https://shop.wordup.com.tw/347
多益為什麼要改制?
因為如果能用解題技巧就拿高分,那測驗的可信度就會下降
所以多益改制後,全力防堵解題技巧
如果你不能真正看懂英文句子,你就會被錯誤選項誤導
所以最好的辦法就是紮實累積來得及寫完的閱讀實力跟速度
但不是「單純增加單字量」就可以提升閱讀速度
而是要培養
👉認字能力:能看到字可以不用思考就能直接理解意思
👉句子拆解:用文法節點把長句拆成一小塊一小塊
這樣才能真正提升閱讀速度外
還能看懂長句中文法的細節意義。
另外,很多同學也常常忽略
多益最常拿來出題的高頻65個溝通事件
80%的多益閱讀內文,就是由這65個溝通事件排列組合而成
這些事件不只結構句型很像
連單字的重複率都超高
因此老師設計了九個學習步驟,分別達成四個目標:
1. 訓練預判能力
2. 實戰培養作答節奏
3. 提升英文實力
4. 修煉閱讀速度
包含脈絡分析、閱讀題目實戰、精讀拆解、用脈絡學會整串單字文法、外師語音導讀
搭配90天的訓練菜單進行雪球複習
用高頻65個事件訓練「認字能力」跟「句子拆解」能力
保證讓你滾瓜爛熟XDD
而且是老師唯一一門終身課程
可以終身使用50小時內容欸!
這次覺得超級佛,老師要準備爆肝了QQ
【課程內容總結大概多少?】
解題示範影片:300部左右
全題目精讀拆解影片:約130部
語音導讀約104篇
高頻脈絡單字卡:精選出約1300個單字
90天菜單含雪球複習
影片總長度:約50小時左右
每週直播共:14小時
【課程內有哪些資源可以下載?】
*課程內經典表意文法講義
*課程內閱讀文章PDF檔
*時間安排計畫表
【適合誰?】
多益350以上
(會建議至少有國中文法的底子/老師的五大文法上完會更好)
【何時開課?】
9/1 開始陸續開放系統
贈送的直播導讀始業式在9/4
會發信通知大家喔!
https://shop.wordup.com.tw/347
我們課堂上見:DDDD✨✨
拆成語 在 alex lam Youtube 的精選貼文
1998年,新時代廣場成為香港電影《生化壽屍》的主要拍攝場地。
新時代廣場(英語:New Trend Plaza)是香港炮台山英皇道278-288號北角中心大廈的1及2樓商場,地下則名為英皇柏麗大道購物中心(英語:King's Park Lane)。
新時代廣場在1974年啟用,曾出租予裕華國貨。1993年,當時的業主均偉投資有限公司替新時代廣場進行翻新,並將商場名稱改為新時代廣場和分拆成180個鋪位出售。
1990年代,新時代廣場的租戶包括遊戲卡店、漫畫店、玩具店、精品店和影印店等。現時,新時代廣場有不少空置的鋪位,餘下的租戶主要是補習社、僱傭代理和中醫診所。
拆成語 在 EHPMusicChannel Youtube 的最佳貼文
❖訂閱頻道收聽更多好聽的歌:https://www.youtube.com/c/EHPMusicChannelII
❖Facebook臉書專頁:https://www.facebook.com/EHPMC/
❖IG:ehpmusicchannel
❖微信公眾號:ehpmusicchannel
----------------------------------------------------------------------------------------------------------
♫ 一鍵收聽你想聽的歌 ♫
❖ 抖音/TikTok專區 ♪:https://www.youtube.com/playlist?list=PLtAw-mgfCzRwduBTjBHknz5U4_ZM4n6qm
❖ 華語歌曲專區 ♪:https://www.youtube.com/playlist?list=PLtAw-mgfCzRz5t_T2v2iuW1pqnj89kY4F
❖ 廣東歌/粵語歌專區 ♪:https://www.youtube.com/playlist?list=PLtAw-mgfCzRxBtfYS-CM3UXto2VbUL8hA
❖ RAP/說唱專區 ♪:https://www.youtube.com/playlist?list=PLtAw-mgfCzRyD5qKNqumkTXqtPiYj3mlr
❖ 古風歌曲專區 ♪:https://www.youtube.com/playlist?list=PLtAw-mgfCzRy9uWRObrUifsgJBdpBEq-y
❖ 翻唱/改編/Remix/EDM 歌曲專區 ♪:https://www.youtube.com/playlist?list=PLtAw-mgfCzRz9-257u_Eknjf0sjW6HDjH
❖ 更多分類歌單:https://www.youtube.com/channel/UC345x_D7DgK5313D3ftM_EQ/playlists?view=50&sort=dd&shelf_id=17
----------------------------------------------------------------------------------------------------------
❖歌詞在下面❖
演唱:林怡婕
作詞 : 木裡的鹿
作曲 : 王潮/ciyo
編曲 : 卡其漠羅洋/王灝
鍵盤:王灝
吉他:大牛用腳彈琴
錄音:黃小文Arvin@廈門御洲文化傳媒
混音母帶工程;姜冉
和聲編寫及演唱:周弦
製作人:馬也_crabbit/姜冉
藝人統籌:Mia
企宣:子甜君
監制:何敏珊
我們說了再見啊
也許就會再見吧 某天
當你繞過世界一圈
坐下和我聊聊這些年
先是一個人冒險
後來燈火闌珊遇見她
終於明白人生寡淡 也感到心安
夏天離開幾個星期
樹葉落大地
等風來再掀起嘆息
聽說你找到下個目的地
帶走所有行李
留我在灰塵裡
我們說了再見啊
也許就會再見吧 某天
當你繞過世界一圈
坐下和我聊聊這些年
先是一個人冒險
後來燈火闌珊遇見她
終於明白人生寡淡 也感到心安
落日燃燒的天際線
流浪的時間
故事都被拆成碎片
預設的未來都與你有關
曾許下的心願
換另一種成全
我們說了再見啊
也許就會再見吧 某天
當你繞過世界一圈
坐下和我聊聊這些年
先是一個人冒險
後來燈火闌珊遇見她
終於明白人生寡淡 也感到心安
我們說了再見啊
也許就會再見吧 某天
等你繞過世界一圈
我們坐下回想那幾年
忘了為何說抱歉
都覺得有點遺憾 懷念
最後像老朋友一樣 還說再見
忘了為何說抱歉
都覺得有點遺憾 懷念
最後像老朋友一樣 笑著說再見
----------------------------------------------------------------------------------------------------------
❖歌曲上架平台
➸ 網易云音樂 | http://music.163.com/song?id=1825648314&userid=1450149887
➸ QQ音樂 | https://c.y.qq.com/base/fcgi-bin/u?__=Sdr0yDM
----------------------------------------------------------------------------------------------------------
❖ 合作郵箱:ehpmusicchannelhk@gmail.com
❖ 微信:EHPMusicChannel(id:xy-z1315)
(歡迎查詢合作/投稿音樂/攝影作品等等)
❖Original Photo by Prapoth Panchuea
❖歌曲版權為歌手本人及其音樂公司所有,本頻道只作推廣及宣傳之用,若喜歡他們的音樂請到以上平台鏈接購買歌曲支持。
❖Like, Comment, Share & Subscribe❖
❖喜歡的請分享及訂閱本頻道❖
拆成語 在 女人?女人! | Facebook - Facebook 的推薦與評價
圖中的字是什麼成語拆成的?測你IQ有多高查看答案 https://www.facebook.com/permalink.php?story_fbid=224909875545877&id=100040805974503. ... <看更多>
拆成語 在 GitHub - fighting41love/funNLP: 中英文敏感词、语言检测 的推薦與評價
... 语音数据集+ 基于深度学习的中文语音识别系统、笑声检测器、Microsoft多语言数字/单位/如日期时间识别包、中华新华字典数据库及api(包括常用歇后语、成语、词语和 ... ... <看更多>
拆成語 在 【解文說字】1018 四句成語拆兩字意友異同相對比 - YouTube 的推薦與評價
臺灣話藝術媠閣好國禎解說兩句仔和你做參考解說解說解文說字2019 :https://youtube.com/playlist?list=PL9X_7mTn8zvXgzFo3UQFwc00OrtKUTh4h2020 ... ... <看更多>