今天给广大网友推荐几款有意思的开源项目,如下:
01网页截屏转为代码
screenshot-to-code 利用先进的大模型识别屏幕截图中的 UI 元素、布局以及其他视觉元素,并将其转换为可编辑的代码,极大地简化了前端开发的流程。
该开源项目已经支持了 Claude Sonnet 3.5 and GPT-4o,目前该开源项目已经在 GitHub 上获得了 57.5k 的 Star!
开源地址:https://github.com/abi/screenshot-to-code02将文档导出为 Markdown 或者 JSON
Docling 专门用于高精度地将文档转换为 JSON 或 Markdown 格式。这种转换不仅能够保持原文档的布局结构完整,还能实现快速稳定的文档解析。
通过 Docling 可以让你的文档对 AI 大模型处理做好准备:
① 高精度转换:Docling 利用了 AI 技术,能够准确地识别和解析各种格式的文档(PDF、DOCX、HTML等)中的文本和图像,确保转换后的文档内容一致。② 多功能性:除了支持稳定到 JSON 和 Markdown 的转换外,Docling 还提供了 OCR(光学字符识别)功能,能够识别扫描或手写文档中的文本。
③ 线性处理管道:Docling 实现了一个线性处理管道,按顺序对每个文档执行操作,确保每个步骤都能顺利完成,从而提高整个转换过程的效率。
④ 开源特性:作为一个开源项目,Docling 的源码完全公开,可以自由下载和修改,适应不同需求的开发者。
开源地址:https://github.com/DS4SD/docling03自动写代码的 AI 助手
OpenHands 是由 All-Hands-AI 团队开发的一个强大平台,旨在通过 AI 驱动的开发代理(agents)帮助开发者“写更少的代码,完成更多的工作”
目前已经获得了 33k 的 Star,它有如下特性:
① 自动化软件开发流程:通过 AI 代理实现自动化。它可以模仿人类开发者的行为,例如修改代码、执行命令、浏览网络、调用 API,甚至可以从社区平台(如 StackOverflow)复制代码片段。简而言之,OpenHands 让开发过程更加高效和智能。
② 支持多种环境的快速部署:提供了基于 Docker 的快速启动方式。用户可以通过简单的 Docker 命令快速部署 OpenHands 实例,这对于需要频繁测试和开发的用户来说极为便利。同时,兼容多种 AI 模型,例如 Anthropic 的 Claude 3.5 Sonnet,并提供 API 接口的灵活支持。
③ 广泛的应用场景:无论是小型项目的开发自动化,还是大型企业的代码管理,OpenHands 都具有很高的适用性。它支持复杂的开发需求,如代码优化、自动测试、代码审查等,有助于减少开发中的重复性工作,让开发者专注于更有创造性的任务。
开源地址:https://github.com/All-Hands-AI/OpenHands04开源的 RAG 工具
Kotaemon 是一个 开源的 RAG(Retrieval-Augmented Generation)工具,专为实现文档问答功能而设计。它不仅适用于终端用户的文档问答需求,也为开发者提供了一个灵活的 RAG 管道构建框架。以下是它的主要特点:
① 简洁界面:Kotaemon 提供了一个清晰、极简的 UI,使用户可以方便地进行基于 RAG 的问答。
② 多 LLM 支持:兼容多种大型语言模型(LLM)API,包括 OpenAI、AzureOpenAI、Cohere 等,还支持本地 LLM。
③ 简单安装:通过一键脚本即可快速上手,方便非技术用户体验。
开源地址:https://github.com/Cinnamon/kotaemonKotaemon 为那些希望将文档问答应用集成到工作流中的用户和开发者提供了一个极具潜力的解决方案,不仅安装方便,还具备高度的灵活性与兼容性。