AI领域常用大模型地址及下载方法(持续更新)

AI百科2个月前发布 快创云
44 0

  随着人工智能技术的不断发展,大模型在各类应用中的表现愈发引人注目。这些模型需要不断调试和对比,以找到最佳性能。同时,收集和学习这些大模型也显得尤为重要。

  基座模型,如GPT-3.5,是一种通用、预训练的语言模型,适用于各种自然语言处理任务。而对话模型则专注于对话系统,通过大规模对话数据预训练,以更好地理解和生成自然对话。在实际应用中,基座模型通常会进行微调,以适应特定任务或领域。对话模型也是如此,通过微调使其更好地理解和生成对话。

  当前主流的大模型包括:

  1. ChatGLM-6B及其升级版ChatGLM2-6B,提供多版本下载,引入GLM多卡部署等特性;
  2. LLaMA及其中文版本Chinese-LLaMA-Alpaca,通过扩充中文词表并二次预训练,提升中文基础语义理解能力;
  3. Mistral 7B和Mistral-8x7B,前者号称最好的7B模型,后者性能超越Llama2-65B;
  4. BAAI/bge-reranker-base,在向量检索、相似度匹配等领域表现优异;
  5. Yi-9B,是Yi系列中代码和数学能力最强的模型,消费级显卡即可运行。

  此外,还有信息抽取、实体识别关系抽取数据集、图谱项目等丰富资源供开发者使用。例如,UIE(Universal Information Extraction)框架实现了多种任务的统一建模;SeqGPT是一个不限领域的文本理解大模型;DeepKE、NeuralKG等工具支持知识图谱构建、融合、推理和应用。

  东北大学发布的TechGPT是垂直领域大语言模型,强化了知识图谱构建、阅读理解、文本理解等任务。Whisper是通用语音识别模型,支持多语言语音识别、语音翻译等。Shap-E则以文本或图像为基础生成3D内容。

  对于大模型的下载和使用,提供了多种方式,包括直接使用镜像网站、安装modelscope等。其中,huggingface的镜像网站下载llama2系列模型时,需加相应认证信息才能下载。总的来说,这些资源为开发者提供了丰富的选择,助力他们在AI领域取得更好的成果。

© 版权声明

相关文章