大模型动态
蚂蚁集团开源代码大模型CodeFuse
蚂蚁集团在外滩大会上正式开源了自主研发的代码生成大模型CodeFuse。CodeFuse可以根据开发者输入快速生成代码、添加注释、编写测试用例等,能显著提高研发效率。
项目地址: https://huggingface.co/codefuse-ai
要点:
- CodeFuse是蚂蚁自研的代码生成专属大模型,可以辅助开发自动生成功能代码。
- CodeFuse基于蚂蚁自有大模型开发,在代码补全评测中已超过GPT-4的表现。
- CodeFuse开源内容包括框架和模型等,可广泛应用于开发辅助、IDE插件、数据分析等场景。
Meta计划推出新的AI模型,以更好地与GPT-4竞争
Meta公司正积极采取措施与OpenAI的GPT-4展开竞争,包括购买AI训练芯片、建立数据中心,以及计划在2024年初开始训练新的大型语言模型。
要点:
- Meta公司积极购买AI训练芯片并建设数据中心,为训练新的AI模型做准备。
- Meta计划在2024年初开始训练一种全新的大型语言模型,以与GPT-4竞争。
- Meta此举被视为在生成AI领域迈出重要一步,与Google、微软等科技巨头形成竞争。
基于Llama2的日语LLM发布,参数量达70亿,可与GPT3.5匹敌
日本人工智能初创公司ELYZA发布了基于Meta的Llama2开发的日语语言模型ELYZA-japanese-Llama-2-7b,参数达70亿,性能可与GPT3.5媲美。该模型通过事前学习和事后学习进行优化提升,在手动评估中获得高分,已可匹敌GPT3.5。ELYZA成功将英语等语言的LLM能力引入日语,并通过减少日语学习量改进了Llama2基础上的模型。
要点:
- ELYZA发布日语Llama2语言模型,参数70亿,可匹敌GPT3.5。
- 该模型通过事前学习和事后学习进行性能优化。
- 成功将英语等语言的LLM能力引入日语,减少日语学习量。
聚焦开发者
零前端知识!我使用GPT在15分钟内创建了一个Chrome扩展
作者Lorain利用GPT快速开发了一个Chrome浏览器扩展程序GitHub Searcher,实现通过网页文本选择并右键菜单直接在GitHub上搜索代码,方便程序员提高工作效率。文章详细介绍了GPT辅助开发的流程,以及GitHub Searcher的使用方法和优势。
项目地址: https://github.com/justlorain/ghs
要点:
- 将开发想法告知GPT后,GPT快速生成了可工作的代码框架。
- 仅需解决少量问题,即可使GPT生成的代码实现搜索功能,开发周期仅15分钟。
- 案例说明GPT可辅助开发者快速实现想法,大幅缩短开发时间,即使不熟悉领域。
北邮、南洋理工推沙雕视频数据集FunQA,用算法学习喜剧
北京邮电大学、新加坡南洋理工大学等机构推出了FunQA数据集,其包含超过4000个反直觉视频和312万个文本问答,旨在测试和提高AI模型对反常识视频内容的理解能力。
项目地址: https://funqa-benchmark.github.io/
要点:
- FunQA是一个全新的高质量视频问答数据集,包含4365个反直觉视频和312万个文本问答。
- FunQA包含幽默、创意和魔术3个视频子集,内容具有强烈的反直觉性。
- FunQA设计了时间定位、详细描述、反直觉推理等任务,对模型的理解力提出深入挑战。
免费版妙鸭?智能写真生成插件EasyPhoto:5张照片即可训练模型
FaceChain开发团队推出了一款基于Stable Diffusion的智能写真生成插件EasyPhoto,只需上传少量自拍照片进行模型微调,就可以生成质量逼真的个人写真。
项目地址: https://github.com/aigc-apps/sd-webui-EasyPhoto
要点: 1. EasyPhoto集成了人像增强网络Lora的训练和调优功能,大大降低了用户门槛。 2. 上传5张不同角度的自拍照后进行短时间在线训练,就可以生成逼真效果。 3. 该插件为普通用户提供了便捷的人像生成方案,具有广阔的应用前景。