开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄

大家好,来来为大家解答以下问题,开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄很多人还不知道,现在让我们一起来看看吧!

大家好,又见面了,我是 GitHub 精选君!

背景介绍

在处理敏感文档时,我们常常担心数据的安全性和隐私泄露的风险。privateGPT 正是为了解决这个问题而诞生的。它提供了一种在不连接互联网的情况下与文档进行交互的方式,确保用户的数据完全私密。

privateGPT 的设计旨在全面考虑细节和核心痛点。它提供了一个安全的执行环境,让用户可以在不担心数据泄露的情况下与文档进行交互。

privateGPT 在 GitHub 有超过 29.2k Star,用一句话介绍该项目就是:“Interact privately with your documents using the power of GPT, 100% privately, no data leaks”。

开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄

项目介绍

privateGPT 是一个使用 GPT 的强大功能来与文档进行私密交互的项目。它完全保护用户隐私,没有数据泄露的风险。privateGPT 通过结合 LangChainGPT4AllLlamaCppChromaSentenceTransformers 构建而成。

这个项目解决了与敏感文档交互时的安全性和隐私保护的问题。它提供了一个执行环境,让用户能够使用 GPT 的功能向文档提问,获取所需的信息,而无需连接互联网。

主要功能特点:

  • • 提供私密的文档交互功能,无需担心数据泄露
  • • 支持多种文档格式,包括 CSV、Word 文档、EverNote、Email、EPub、HTML 文件、Markdown、Outlook Message、Open Document Text、PDF、PowerPoint 文档和纯文本文件
  • • 可自定义选择不同的 GPT4All-J 兼容模型
  • • 集成了 SentenceTransformers,提供更好的语义理解和查询效果

如何使用

首先,按照以下步骤设置运行环境:

  1. 1. 安装所有依赖项:pip3 install -r requirements.txt
  2. 2. 下载 LLM 模型,并将其放置在任意目录下:• 默认使用 ggml-gpt4all-j-v1.3-groovy.bin 作为 LLM 模型。如果你想使用其他 GPT4All-J 兼容模型,只需下载该模型,并在 .env 文件中引用它。
  3. 3. 将 example.env 重命名为 .env,并根据需要编辑其中的变量:

MODEL_TYPE: supports LlamaCpp or GPT4All
PERSIST_DIRECTORY: is the folder you want your vectorstore in
MODEL_PATH: Path to your GPT4All or LlamaCpp supported LLM
MODEL_N_CTX: Maximum token limit for the LLM model
MODEL_N_BATCH: Number of tokens in the prompt that are fed into the model at a time. Optimal value differs a lot depending on the model (8 works well for GPT4All, and 1024 is better for LlamaCpp)
EMBEDDINGS_MODEL_NAME: SentenceTransformers embeddings model name (see https://www.sbert.net/docs/pretrained_models.html)
TARGET_SOURCE_CHUNKS: The amount of chunks (sources) that will be used to answer a question

然后只需将你需要使用的私有文档放在 source_documents 文件件下。

开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄

运行命令 python ingest.py 将会把私有的文档进行向量化,在需要与 GPT 交互时提前进行向量化的匹配。

开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄

执行完成之后,运行 python privateGPT.py 即可与上述私有文档进行聊天对话,问任何你想知道的问题。

开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄

以下是该项目 Star 趋势图(代表项目的活跃程度):

开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄

更多项目详情请查看如下链接。

开源项目地址:https://github.com/imartinez/privateGPT

开源项目作者:imartinez

以下是参与项目建设的所有成员:

开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄

关注我们,一起探索有意思的开源项目。

本文到此结束,希望对大家有所帮助。

焦睿天微信号:焦睿天扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1 到不了歌词(到不了歌词范玮琪)

    大家好,小豪今天来为大家解答到不了歌词以下问题,到不了歌词范玮琪很多人还不知道,现在让我们一起来看看吧!1、你眼睛会笑,弯成一条桥

  2. 2 研究生读书报告(研究生读书报告范文3000字)

    大家好,小丽今天来为大家解答研究生读书报告以下问题,研究生读书报告范文3000字很多人还不知道,现在让我们一起来看看吧!1、一、前言 读书

  3. 3 民族歌曲大全100首流行歌曲(民族歌曲大全100首流行歌曲下载)

    大家好,小伟今天来为大家解答民族歌曲大全100首流行歌曲以下问题,民族歌曲大全100首流行歌曲下载很多人还不知道,现在让我们一起来看看吧!

  4. 4 贞观小说完结(贞观长篇小说)

    大家好,小丽今天来为大家解答贞观小说完结以下问题,贞观长篇小说很多人还不知道,现在让我们一起来看看吧!1、《大唐小郎中 》、《调教初唐

  5. 5 什么言什么什么(什么言什么什么的四字成语)

    大家好,小豪今天来为大家解答什么言什么什么以下问题,什么言什么什么的四字成语很多人还不知道,现在让我们一起来看看吧!1、一言为定 冷言

  6. 6 请输入接收邮件服务器(pop)(请输入邮件是什么意思)

    大家好,小娟今天来为大家解答请输入接收邮件服务器(pop)以下问题,请输入邮件是什么意思很多人还不知道,现在让我们一起来看看吧!1、填写的

  7. 7 场所的同义词(场所相近的词语)

    大家好,小豪今天来为大家解答场所的同义词以下问题,场所相近的词语很多人还不知道,现在让我们一起来看看吧!1、场的同义词有:场所 场地

  8. 8 老年合唱团名字大全(老年合唱团名字创意)

    大家好,小伟今天来为大家解答老年合唱团名字大全以下问题,老年合唱团名字创意很多人还不知道,现在让我们一起来看看吧!1、雪绒花歌唱兴趣

Copyright 2024 看看网,让大家及时掌握各行各业第一手资讯新闻!