ArgosOS是一个现代桌面应用程序,用于智能文档管理,具有AI支持的分析功能。它使用Python(FastAPI)、React(TypeScript)和Electron构建,支持多种文件格式,包括PDF、DOCX、TXT、MD和图像文件。该系统具备高级文本提取功能,如PDF的OCR回退、DOCX的直接文本提取和图像的ChatGPT视觉API。它还提供AI分析、持久存储、重复内容删除、智能搜索和完整的CRUD操作。最新版本v1.3.0修复了Electron应用程序启动问题,改进了搜索功能,并增强了代码质量和错误处理。
-
项目简介
ArgosOS是一个现代桌面应用程序,用于智能文档管理,具有AI支持的分析功能。使用Python(FastAPI)、React(TypeScript)和Electron构建。 -
特征
多格式支持:PDF、DOCX、TXT、MD和图像文件(JPG、PNG、GIF、BMP、TIFF、WebP)。高级文本提取:PDF使用PyMuPDF直接提取文本,并带有OCR回退(无Poppler依赖);DOCX使用python-docx直接提取文本;图片使用具有OCR回退的ChatGPT视觉API。AI分析:OpenAI支持的摘要和标记。持久存储:使用内容寻址存储保存到磁盘的文件。重复内容删除:基于SHA-256的重复数据删除。原生桌面应用程序:跨平台Electron应用程序。智能搜索:具有人工智能后处理功能的自然语言文档搜索。完整的CRUD:上传、查看、搜索和删除文档。安全性:加密API密钥存储、输入验证和SQL注入保护。分发:可随时分发的DMG、EXE和AppImage包。 -
最新更新
v1.3.0 – Electron应用程序稳定性和增强搜索。修复了Electron启动问题,更新了数据库架构,改进了PDF处理,增强了搜索体验,修复了API集成问题,改进了错误处理和代码质量。 -
快速入门
先决条件:Python 3.11+,Node.js 18+,Poetry,Tesseract OCR。安装:克隆存储库并安装依赖项。运行应用程序:使用./start-electron.sh脚本。 -
项目结构
ArgosOS/ ├── app/ # Python后端 │ ├── agents/ # AI代理 │ ├── db/ # 数据库模型和CRUD │ ├── llm/ # LLM提供者(OpenAI) │ ├── config.py # 配置 │ └── main.py # FastAPI应用程序 ├── frontend/ # React + Electron前端 │ ├── src/ # React组件 │ ├── electron/ # Electron主进程 │ └── package.json # 前端依赖项 ├── tests/ # 测试套件 ├── data/ # 数据库和文件存储 ├── pyproject.toml # Python依赖项(Poetry) └── start-electron.sh # 启动脚本 -
用法
上传文档:拖放文件或使用本机文件选择器。配置AI:在AI功能的设置中添加您的OpenAI API密钥。搜索:使用自然语言查找文档。管理:查看、组织和管理文档库。 -
开发
后端开发:使用Poetry运行Python应用程序。前端开发:使用npm运行React开发服务器。运行测试:使用Poetry运行pytest。构建分发:使用./build-with-poetry.sh脚本。 -
安全功能
加密的API密钥存储,输入验证和清理,SQL注入保护,CORS配置,文件类型和大小验证,路径遍历保护。 -
系统概述
ArgosOS是一个三层桌面应用程序,具有人工智能驱动的文档处理功能。它包括Electron桌面应用程序、FastAPI后端和外部服务(如OpenAI和Tesseract)。 -
核心组件
前端(Electron + React),后端(FastAPI),人工智能代理,文本提取管道,数据库(SQLite),文件存储。 -
数据流
上传:用户将文件上传到Electron,然后传递到FastAPI和IngestAgent。处理:文件经过TextExtractor和AI分析后存储到数据库。搜索:查询通过RetrievalAgent和PostProcessorAgent处理,结果显示在React UI中。 -
如何下载
选项1:预生成版本(推荐)。选项2:从源代码克隆。 -
如何部署
本地开发:安装依赖项并运行应用程序。生产构建:构建Electron应用程序并创建分发包。Docker部署:构建Docker镜像并运行容器。 -
系统要求
最低要求:操作系统Windows 10+、macOS 10.15+、Ubuntu 18.04+,内存4GB,存储空间1GB,Python 3.11+(开发),Node.js 18+(开发)。推荐要求:操作系统最新版本,内存8GB+,存储5GB+,CPU多核处理器,互联网连接。 -
依赖
系统依赖:macOS使用brew安装Tesseract,Ubuntu/Debian使用apt-get安装Tesseract,Windows从GitHub下载。Python依赖项由Poetry管理,Node.js依赖项由npm管理。 -
故障排除
常见问题包括端口已被使用、Tesseract未找到、Poetry未找到、Node.js版本问题、数据库问题、文件上传问题和Electron应用程序问题。提供了相应的解决方案。 -
调试模式
通过设置环境变量LOG_LEVEL为DEBUG并运行./start-electron.sh脚本来启用调试日志。 -
性能优化
提高OCR性能:使用SSD存储,增加RAM分配,调整Tesseract PSM模式。减少内存使用:以较小的批次处理文件,定期清除缓存,监控文件大小。提高搜索速度:索引频繁搜索的术语,使用数据库优化,实现结果缓存。
数据统计
数据评估
本站久留网提供的ArgosOS都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由久留网实际控制,在2025年9月28日 上午11:07收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,久留网不承担任何责任。
津公网安备12011602000248号