研究團隊在Phind 內部數據集上對Code Llama-34B 和CodeLlama-34B- Python進行微調之後發現,這兩款模型微調之後在HumanEval 測試中的通過率均已超過GPT-4在3月份的成績。
本次發布的Code Llama是在Llama 2的基礎上,通過特定的代碼數據集進一步訓練而來,支持C++、 Java 、 Python 、 PHP 、 Typescript (Javascript)、 C#和Bash等眾多流行語言,依然是開源可商用。
Code Llama對編程專家和初學者都非常有用,無論是用專業的編程語言還是用自然語言(如普通話)來描述編程需求,Code Llama都能理解,並很好地生成相應的代碼或與代碼相關的解釋。這極大降低了開發門檻和效率。
Code Llama是Meta公司開源可商用大模型Llama 2的編程版本,據悉,Code Llama分為7B、13B和34B三個不同參數版本,可滿足不同的服務和延遲要求。每個版本的模型都使用了500B tokens與代碼相關的數據進行訓練。