标签: OCR

  • DeepSeek OCR APP- 由 DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序,直接在线识别各种图像

    模型介绍

    DeepSeek_OCR_APP,为DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序,直接在线识别各种图像,需要自行部署。

    硬件:支持 CUDA 的 NVIDIA GPU,推荐:RTX 3090、RTX 4090、RTX 5090 或更高版本,最低要求:8-12GB VRAM(适用于该型号),更多的 VRAM 总是好的!

    模型截图

    All birds品种丰富色彩鲜艳,栖息在繁花似锦的春日树枝上,展现自然生态之美.
    2020年到2006年数据线性增长折线图.

    核心功能

    4 种核心 OCR 模式

    • 纯文本 OCR – 从任何图像中提取原始文本
    • 描述– 生成智能图像描述
    • 查找– 使用视觉边界框定位特定术语
    • 自由形式——针对特殊任务的自定义提示

    UI 功能

    🔍 多边界框支持(处理找到的术语的多个实例)

    🎨 具有动画渐变的玻璃形态设计

    🎯 拖放文件上传(默认最大 100MB)

    🗑️ 轻松删除图像并重新上传

    📦 具有适当坐标缩放的接地盒可视化

    ✨ 流畅的动画(Framer Motion)

    📋 复制/下载结果

    🎛️ 高级设置下拉菜单

    📝 HTML 和 Markdown 渲染以进行格式化输出

    快速配置

    1. 克隆并配置:git clone <repository-url> cd deepseek_ocr_app # Copy and customize environment variables cp .env.example .env # Edit .env to configure ports, upload limits, etc.
    2. 启动应用程序:docker compose up –build第一次运行将下载模型(~5-10GB),这可能需要一些时间。
    3. 访问应用程序:

    模型链接

    github:https://github.com/rdumasia303/deepseek_ocr_app

  • STranslate:即用即走的翻译、OCR工具

    STranslate:即用即走的翻译、OCR工具

    STranslate是一款翻译、OCR工具。

    打开软件后会静默在后台,等待调用,点击软件外部任意处即自动隐藏到后台——即用即走。

    支持多种翻译语言,支持输入、划词、截图、监听剪贴板、监听鼠标划词等多种翻译方式。支持中英日韩完全离线OCR,同时支持微信、百度、腾讯、OpenAI、Google等OCR。

    软件截图

    软件链接

    网站地址 :https://stranslate.zggsong.com/docs/

    项目地址:https://github.com/ZGGSONG/STranslate