別怕沒工作！AI寫程式碼強過人類？新研究曝光這類問題ChatGPT會卡關

2024-07-09 09:47 聯合新聞網 INSIDE

程式設計師花費數十年編寫 AI 模型的程式碼，如今，AI 反過來被用來編寫程式碼，形成一個有趣的循環。（示意圖／路透）

AI 如今已能編寫程式碼，但其表現如何？《IEEE 軟體工程彙刊》（IEEE Transactions on Software Engineering）最新研究評估了 OpenAI 的 ChatGPT 在程式碼生成方面的能力。結果顯示，ChatGPT 的表現差異極大，成功率從 0.66% 到 89% 不等，取決於任務難度和程式語言等因素。

參與這項研究的 Glasgow 大學講師 Yutian Tang 指出，AI 程式碼生成雖有優勢，但了解其局限性同樣重要。

研究團隊測試了 GPT-3.5 解決 728 個 LeetCode 問題的能力，涵蓋 5 種主要程式語言，涵蓋 C、C++、Java、JavaScript 和 Python。

結果顯示，ChatGPT 在 2021 年之前的問題上表現較佳，它能夠為簡單、中等和困難的問題產生功能性程式碼，成功率分別高達 89%、71% 和 40%。

但面對新問題時能力明顯下降。「簡單」問題的成功率從 89% 降至 52%，「困難」問題更是從 40% 跌至 0.66%。Tang 認為這可能與訓練數據有關。

結果還顯示，C 語言生成的程式碼最為複雜，其次是 C++，而 Python 的複雜度則與人類編寫的程式碼相當。

值得注意的是，ChatGPT 生成的程式碼在效能上優於至少 50% 的人類解決方案。然而，它不擅長糾正自身的邏輯錯誤，且存在一些安全漏洞，雖然大部分漏洞都是易於修復的。

Tang 建議，開發者在使用 ChatGPT 時應提供充分的背景資訊和潛在風險提示，以提高輸出品質。

《本文作者INSIDE 硬塞的網路趨勢觀察，原文刊登於合作媒體INSIDE，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！

　訂閱《科技玩家》YouTube頻道！
💡 追新聞》》在Google News按下追蹤，科技玩家好文不漏接！
📢 Apple Pay、信用卡搭北捷「只扣1元」是沒刷到嗎？官方曝扣款規則秒懂
 📢 iPhone來電畫面有2種！設計巧思超貼心滑動接聽、拒接方法一次看
 📢 DJI Mic Mini 2開箱！實測ASMR、降噪收音驚豔彩色磁吸前蓋可更換
 📢北捷Apple Pay信用卡嗶進站變「深蹲感應區」！官方曝設計原因：會再調整
 📢獨／STUDIO A遇蘋果漲價要求「補差價」 4關鍵自保：店家不一定免責
 📢 LINE免費貼圖4款！「蛤」字必下載爽用半年、熊大兔兔動態圖超Q

INSIDE

INSIDE 是台灣科技媒體領導品牌，成立於 2009 年 11 月底...

程式語言 ChatGPT AI 網路功能程式碼任務效能 OpenAI Java

別怕沒工作！AI寫程式碼強過人類？新研究曝光這類問題ChatGPT會卡關

INSIDE

推薦文章

台灣首次戰爭「行動斷網」演習！8月14縣市演練時間、規則曝光 QA一次看

用悠遊卡搭北捷…iPhone放口袋卻重複扣款！官方曝解法

LINE免費貼圖7款！LV精品款用到明年1月諧音哏「熱到兔」ㄅ級分快下載

國家級「行動斷網」演習完整指引！NCC揭3重點：勿用手機處理重要工作

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

8月「行動斷網」演習手機降速2天為何排除南部？NCC曝真正原因

別怕沒工作！AI寫程式碼強過人類？新研究曝光 這類問題ChatGPT會卡關

INSIDE

推薦文章

台灣首次戰爭「行動斷網」演習！8月14縣市演練時間、規則曝光 QA一次看

用悠遊卡搭北捷…iPhone放口袋卻重複扣款！官方曝解法

LINE免費貼圖7款！LV精品款用到明年1月 諧音哏「熱到兔」ㄅ級分快下載

國家級「行動斷網」演習完整指引！NCC揭3重點：勿用手機處理重要工作

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

8月「行動斷網」演習手機降速2天 為何排除南部？NCC曝真正原因

別怕沒工作！AI寫程式碼強過人類？新研究曝光這類問題ChatGPT會卡關

LINE免費貼圖7款！LV精品款用到明年1月諧音哏「熱到兔」ㄅ級分快下載

8月「行動斷網」演習手機降速2天為何排除南部？NCC曝真正原因