MoneyDJ新聞 2025-09-22 11:19:43 新聞中心 發佈
中華電信(2412)研究院自主研發「VLM(Vision Language Model)視覺影像分析技術」,在全球指標性競賽2025 AI City Challenge中脫穎而出,榮獲「交通安全描述與分析(Traffic Safety Description and Analysis)」競賽項目排行榜第一名。該成果獲大會邀請,將於10月20日至美國夏威夷舉行的頒獎典禮上發表論文,充分展示中華電信於智慧城市AI應用領域深厚的研發實力與創新能量。
AI City Challenge由NVIDIA聯合多所國際頂尖大學共同主辦,為全球電腦視覺領域最具指標性的國際競賽之一。該競賽聚焦於真實世界的交通與城市AI應用,提供810個影片和155個場景,邀請全球頂尖團隊共同以AI競技。參賽團隊須以AI技術描述影片中事故發生前的連續瞬間,並標註所有與周圍環境、注意力、位置以及行人和車輛行為相關的細節,影片內容涵蓋車輛與行人辨識、跨鏡頭追蹤、異常行為偵測與交通事件語意分析等關鍵主題,詮釋預警能力愈精確及快速者,將可獲得最高分數。
中華電信研究院CHTTLIOT團隊所研發的模型,以優越的分析預警能力,解析大會提出的各式高複雜交通場景,突破過往AI分析應用瓶頸,整合「全域–局部影像理解Keyframe-Based Global-Local View Construction」及「雙任務學習強化語境推理Dual-Task Supervised Learning」技術,深度理解與語意化分析交通事件,精準的預判能力成功於競賽排行榜中位居第一名。
此技術也於競賽中精準辨識行人、車輛及其互動關係,預先分析潛在的衝突情境。以自動生成精確的語意描述能力,辨識違規或危險行為,協助即時預警及輔助決策。此技術輔助影像描述及問答競賽的任務中,其較傳統模型準確率大幅超過22%,成果表現令人驚艷。
中華電信研究院院長蘇添財表示,此次CHTTLIOT團隊在AI City Challenge競賽排行榜中獲得第一名席次,證明中華電信的AI視覺語言技術已達國際領先水準,也展現台灣在智慧城市治理創新上的堅實實力;透過在地化資料進行模型優化,結合邊緣運算部署,中華電信將持續推動VLM技術應用於智慧交通、公共安全等多元場域,為全體市民打造更安全、即時與智慧的城市生活。
中華電信未來將持續深化AI模型泛化能力與即時運算效能,推動輕量化VLM模型應用於邊緣裝置,提升第一線感知反應速度,助力智慧城市加速實現。