專訪》他用AI對付AI!曾抓出論文抄襲案的「快刀」,能辨識AI生成文章?
?
「快刀AI先生」團隊創辦人林政宏。黃菁慧攝
曾抓出李眉蓁、林智堅等論文抄襲事件的文章比對系統「快刀」,近日搭上ChatGPT浪潮,順勢推出可辨識AI生成文字的「快刀AI先生」。團隊創辦人林政宏接受《遠見》專訪,這家只有11人的小公司,如何搶攻AI市場大餅?
「生成式AI來了以後,生意真的很好。」最近,雲書苑教育科技總經理林政宏勤跑市區開會,位於北投的辦公室因準備擴編而整修中,外人不便進入。採訪當天也不例外,他剛結束行程,便匆匆在附近與我們會合。
這家規模僅11人的小公司,成立十餘年來,在學術界扮演舉足輕重的地位。2010年,雲書苑推出中文相似度比對系統「快刀」,協助找到前國防部長楊念祖、高雄市議員李眉蓁、前新竹市長林智堅等人的論文抄襲案,至今在全國大專院校擁有7成市占率,更曾獲國家玉山品牌獎殊榮。
去年底,Open AI推出聊天機器人ChatGPT,為學術界的抄襲現象帶來新隱憂。挾著累積多年龐大資料庫、及長年投入自然語言處理(NLP)開發的實力,雲書苑順勢於3月份推出全球首創的「快刀AI先生」,丟入文章,系統就能判定由AI生成的比例,一推出便廣受學術界探詢。
糾出《紅樓夢》文風差異,鎖定開發文章比對系統
雲書苑能有今天,最早還得從林政宏的童年開始說起。
1977年蘋果推出風行全球的微電腦Apple II,彼時就讀國小的林政宏,玩電腦就是生活中最大樂趣。
「那時候只覺得電腦太難用、要跟它描述自己的需求還真困難。」林政宏回憶當時,一種想有效達成「人機溝通」的憧憬萌生,爾後一路考上台大資工系,開始鑽研少有人投入的自然語言處理(NLP),懷有創業家精神的他,畢業後陸續成立過軟體公司、也曾於海外從事創投工作。直到2010年左右,他萌生開發文章比對系統的點子,找出至今仍存有作者爭議的《紅樓夢》進行實驗。
「胡適用他的國學涵養,證明《紅樓夢》前80回和後40回是不同人寫的,但我們想展現科學上的根據,」於是,團隊將全書進行斷詞,建立作者的用詞習慣表,最終落點分析結果一目了然:前後作者的「文風」毫不重疊。
林政宏解釋,儘管書寫者的文風可能隨時間轉變,但必然會經過演進過程,不可能直接跳換新風格,由此便能分辨書寫者的差異。
圖/林政宏解釋,書寫者的文風可能隨時間轉變,但不可能直接跳換新風格,由此便能分辨書寫者的差異。黃菁慧攝
有了技術基礎,下一步就得思考應用場域。正巧團隊成員在寫論文過程中,難免碰上引用問題,加上林政宏在閱讀他人論文時,也常感受到抄襲現象,促使他們抓準論文比對的商機,進而推出「快刀」。
林政宏說明,一篇5萬字論文約得和2億篇文章進行比對才夠精準,團隊光是前期擴充資料庫,就耗費大量心力。緊接著,為加速商業應用,他們建立起「特徵比對」機制,抽取文中重要段落進行斷詞,與龐大資料庫進行文風分析,最終得出相似性比例,再交由審查單位進行判定,如今一篇論文僅需十分鐘便能完成檢測。
事實上,快刀並非全球首創的產品,大專院校過去也常導入國外比對系統Turnitin,但林政宏指出,中文詞性經常轉變,其複雜度堪稱所有語言之最,國外公司要跨入、並掌握足夠多的中文文獻並不容易,也讓他們站穩利基點。
與Open AI系出同門,可辨識ChatGPT書寫邏輯
十多年前,社會對論文抄襲的關注度尚不高,直到2013年,前國防部長楊念祖遭控涉嫌抄襲,上任僅六天便下台,引發輿論譁然。過去雲書苑還得努力說服學校採購快刀,一夕間,各校紛紛親自上門尋求協助。
「這幾年大家開始發現,原來一個人的誠信可以從論文反映,」林政宏說,不只學術界,如今企業人資部門也會導入快刀查證高階主管論文,金管會甚至將之用在審查上市櫃公司的永續報告書,可見應用範圍之廣。
長年累積的龐大資料庫,讓雲書苑在ChatGPT推出後,能快速推出「快刀AI先生」作出應對。簡單來說,機器學習的方式,是將語言結構切割後,經由訓練形成一套字詞排列的規律,本身並無意識。因此,對早就投入自然語言處理的雲書苑而言,他們輕鬆就能辨識ChatGPT的書寫邏輯。
「我們的演算法跟Open AI系出同門,真是撿到一個天大的禮物!」林政宏笑得開懷。
最近,許多學校老師正為ChatGPT頭痛不已,紛紛找上他們。其使用方法和快刀類似,僅須將文字丟入系統,便會生成疑似由AI生成的比例。
圖/記者以ChatGPT生成短文,交由快刀AI先生實測,顯示有高達96%機率為AI所寫。截自快刀AI先生
見證AI從零到有,「跳上火箭就對了!」
不過挑戰就在於,如今學生已會將AI生成的文字一改再改,並丟回ChatGPT重新生成,形成人機協作的「混合體」,根本難單憑相似度比例做出判斷,那快刀AI先生存在的意義又為何?
林政宏強調,快刀AI先生是輔助而非裁判角色,有時可協助老師事先了解學生學習程度,進而調整教學模式。
事實上,除了「快刀」和「快刀AI先生」兩套教育工具外,下一步,林政宏腦中又有了新的計畫。
林政宏從包包中抽出一本繪本,乍看普通,一問之下,才發現是他就讀小二的兒子發想文字內容後,請他利用AI生成圖像而成的作品。
眼見兒子對AI創作極有興趣,林政宏遂投入開發新產品,預計兩個月後將推出AI繪本系統,主攻低齡教育市場,「小朋友說故事給小朋友聽,這在人類史上還真的是頭一回吧!」他笑道。
從一個單純愛玩電腦、試圖和機器溝通的小男孩,到如今利用AI影響了教育界,見證從零到有,林政宏形容,就像搭上火箭一般充滿快感,「總覺得未來充滿希望,火箭正在升空了,跳上火箭就對了!」
【雲書苑教育科技小檔案】?
成立年份:2011年
總經理暨創辦人:林政宏
主力產品:快刀、快刀AI先生
員工數:11人
年營業額:約上千萬元台幣
https://www.gvm.com.tw/article/101965
鄒純敏於2023/4/28 下午 03:22:39更新
當日瀏覽數(11)│回應數(0)│轉寄數(0) │引用數(0)