時間:2023-03-21|瀏覽:386
OpenAI 官宣 GPT-4 引起軒然大波,比前身更受歡迎 GPT-3.5 更可靠,更有創意。GPT-4 可接受圖像和文本輸入,然后輸出正確的文本回復,是一種大型多模態模型。實驗表明,GPT-4 在各種專業測試和學術基準方面的表現與人類水平相當。例如,它通過了模擬律師考試,分數在考生面前 10% 左右;相比之下,GPT-3.5 得分倒數 10% 左右。
大型語言模型的子彈不斷飛行,ChatGPT 職業“威脅論”也成為熱議的焦點。例如,INSIDER 準備一份被子 AI 取代風險最高的工作清單,技術工作(編碼員、計算機程序員、軟件工程師、數據分析師)、媒體工作(廣告、內容創作、技術寫作、新聞)、法律行業工作(律師助理、法律助理)、市場研究分析師、教師、財務職位(財務分析師、個人財務顧問)、貿易商、平面設計師、會計師和客戶服務代理。
昨天,一篇由 OpenAI、OpenResearch 與賓夕法尼亞大學學者合作的論文發表在預印本網站上 arXiv 以科學的方式進行研究 GPT 會對勞動力市場產生怎樣的影響?本研究采用了一種新的評估方法,即根據職業和職業 GPT 結合人類專業知識和能力的對應性來評價職業 GPT-4 從而討論分類 GPT 可能對勞動力市場產生影響。
為了理解 LLM 本研究應用的兩個評價標準是:直接暴露的能力及其對工作的潛在影響(exposure),即 GPT 可以直接完成或幫助完成的任務;間接暴露,即通過 GPT 幫助完成支持軟件和數字工具的任務。
研究發現,大多數職業在一定程度上表現出來 GPT 暴露,大約 80% 至少可能有美國勞動力 10% 將完成工作任務 GPT 影響,大約 19% 至少可能有工人 50% 任務受到影響。這種影響涵蓋了所有的工資水平,高收入工作可能面臨更大的風險。
嚴重依賴科學和批判性思維技能的角色 GPT 編程和寫作技巧與暴露呈負相關 GPT 暴露是正相關的。在工作中面臨更高(更低)壁壘的工人往往會經歷更多(更少)。 GPT 暴露。信息處理行業暴露程度高,而制造業、農業和礦業暴露程度低。
生產力的增長和過去十年的總體增長 GPT 暴露之間的聯系似乎很弱,這表明未來大型語言模型生產力的增長可能不會加劇可能的“成本疾病”效應,這是一種潛在的樂觀情況。
GPT就是GPT
GPT 三個符合一般目的技術的核心標準:隨著時間的推移,它們正在即興發揮能力,能夠完成或幫助一組越來越復雜的任務和用例;GPT 它本身可以對整個經濟產生普遍影響;同時,GPT 互補創新,特別是通過軟件和數字工具,可以廣泛應用于經濟活動中。
決定大型語言模型有效性的關鍵因素是人類對它們的信任和習慣。例如,在法律界,模型的有用性取決于法律專業人員是否可以信任其輸出,而無需核實原始文件或進行獨立研究。技術的成本和靈活性、員工和公司的偏好以及激勵措施也在基于大型語言模型的工具中發揮著重要作用。
此外,由于數據可用性、監管質量、創新文化、權力和利益分配等因素,大型語言模型在不同經濟部門的應用也會有所不同。因此,如果我們想充分了解員工和公司對大型語言模型的使用,我們需要更深入地探索這些復雜的問題。一種可能性是,節省時間和無縫應用比提高質量更重要。
總的來說,盡管 GPT 提高人類勞動效率的技術能力是顯而易見的,但重要的是要認識到,社會、經濟、監管等因素可能會影響實際的勞動生產率。隨著能力的不斷發展,GPT 對經濟的影響可能會繼續和增加,這挑戰了政策制定者對其發展軌跡的預測和監督。