标签： deepseek

DeepSeek OCR APP- 由 DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序，直接在线识别各种图像
模型介绍

DeepSeek_OCR_APP，为DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序，直接在线识别各种图像，需要自行部署。

硬件：支持 CUDA 的 NVIDIA GPU，推荐：RTX 3090、RTX 4090、RTX 5090 或更高版本，最低要求：8-12GB VRAM（适用于该型号），更多的 VRAM 总是好的！

模型截图

核心功能

4 种核心 OCR 模式
- 纯文本 OCR – 从任何图像中提取原始文本
- 描述– 生成智能图像描述
- 查找– 使用视觉边界框定位特定术语
- 自由形式——针对特殊任务的自定义提示
UI 功能

🔍 多边界框支持（处理找到的术语的多个实例）

🎨 具有动画渐变的玻璃形态设计

🎯 拖放文件上传（默认最大 100MB）

🗑️ 轻松删除图像并重新上传

📦 具有适当坐标缩放的接地盒可视化

✨ 流畅的动画（Framer Motion）

📋 复制/下载结果

🎛️ 高级设置下拉菜单

📝 HTML 和 Markdown 渲染以进行格式化输出

快速配置
1. 克隆并配置：git clone <repository-url> cd deepseek_ocr_app # Copy and customize environment variables cp .env.example .env # Edit .env to configure ports, upload limits, etc.
2. 启动应用程序：docker compose up –build第一次运行将下载模型（~5-10GB），这可能需要一些时间。
3. 访问应用程序：
  - 前端：http://localhost:3000（或您配置的 FRONTEND_PORT）
  - 后端 API：http://localhost:8000（或您配置的 API_PORT）
  - API 文档：http://localhost:8000/docs
模型链接

github：https://github.com/rdumasia303/deepseek_ocr_app
2025年10月25日
DeepSeek-V3-0324 发布，推理与代码能力全面升级
近日，DeepSeek AI 正式发布 DeepSeek-V3 模型的小版本升级——DeepSeek-V3-0324。新版本现已开放体验，用户可通过官方网页、App 和小程序关闭“深度思考”后使用，无需更改 API 接口和使用方式。

详情

推理任务能力大幅提升，超越 GPT-4.5
DeepSeek-V3-0324 借鉴 DeepSeek-R1 在训练过程中使用的强化学习技术，在数学与代码相关任务的表现上实现显著提升。最新评测数据显示，在 MATH-500、AIME 2024、LiveCodeBench 等数据集上的表现超过 GPT-4.5，展现出更强的推理与代码生成能力。

前端开发与中文写作能力增强
在 HTML 和前端代码生成方面，DeepSeek-V3-0324 生成的代码可用性更高，视觉效果更加美观，富有设计感。同时，在中文写作任务上，新版本针对中长篇文本创作进行了优化，内容质量更上一层楼。

搜索与工具调用优化，体验更加流畅
新版 V3 模型在联网搜索场景下，对报告类任务的内容输出更加详实准确，排版更清晰。此外，工具调用、角色扮演、问答闲聊等多方面能力均有所提升，使对话体验更加流畅。

开源与私有化部署支持
DeepSeek-V3-0324 沿用 DeepSeek-V3 的 base 模型，仅优化后训练方法。私有化部署时，仅需更新 checkpoint 和 tokenizer_config.json，即可完成升级。模型参数规模约 660B，开源版本支持 128K 上下文长度（网页端、App 和 API 提供 64K）。

链接

模型现已开源，并遵循 MIT License，允许用户利用模型输出或蒸馏训练其他模型。权重下载地址如下：
- ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324
- Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
- 官方新闻稿: https://api-docs.deepseek.com/zh-cn/news/news250325
- 免费在线体验: https://chat.deepseek.com
2025年3月27日

标签： deepseek

DeepSeek OCR APP- 由 DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序，直接在线识别各种图像

模型介绍

模型截图

核心功能

4 种核心 OCR 模式

UI 功能

快速配置

模型链接

DeepSeek-V3-0324 发布，推理与代码能力全面升级

详情

链接