Reddit 文本庫有許多真實對話,這對大型語言模型,模型可以從Reddit的數據中學習人們如何談論不同的主題,表達他們的觀點、情感和幽默感。
有美國PTT 之稱的人氣社交媒體網站Reddit一直以來可以讓網友們發表、評論各式各樣的主題,也因此收集了大量的使用者文本與相關數據,對於各種公司、組織來說都非常有價值,此刻對那些想要用它來訓練人工智慧 (AI )模型尤其特別。
也因此,Reddit決定向使用他們數據的大公司收費!
根據Reddit執行長Steve Huffman的說法,Reddit文本庫有許多真實對話,這對於像Google Bard 、OpenAI ChatGPT等自然語言的AI模型訓練工作非常有用,模型可以從Reddit的數據中學習人們如何談論不同的主題,表達他們的觀點、情感和幽默感。
但Huffman表示,Reddit不想把這個價值白白送給這些世界級巨型公司,因此宣布將推出一個新的方案,讓使用者可以使用它的API,並加上使用限制、使用權利等額外功能給那些想要存取Reddit數據的人。該公司尚未分享定價細節,但表示將於6月19日上線。
無獨有偶,Twitter之前也做了類似決策,今年稍早開始向存取它的API收費。Twitter的API讓開發者可以訪問平台上的推文和其他資訊,其定價根據存取量和數據請求量而有所不同。
Reddit向它的數據收費可能會影響那些依賴大量文本數據的AI模型發展。它也可能鼓勵其他平台以類似的方式對它們的數據進行盈利。
《原文刊登於合作媒體INSIDE,聯合新聞網獲授權轉載。》