| 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235 |
- # 本地大模型配置文件
- models:
- qwen2_vl:
- name: "Qwen2.5-VL-72B-Instruct-AWQ"
- api_base: "http://10.192.72.12:9991/v1"
- api_key: "${YUSYS_MULTIMODAL_API_KEY}"
- model_id: "Qwen2.5-VL-72B-Instruct-AWQ"
- default_params:
- temperature: 0.1
- max_tokens: 4096
- timeout: 180
-
- llava:
- name: "LLaVA-v1.6-34B"
- api_base: "http://localhost:11434/v1"
- api_key: ""
- model_id: "llava:34b"
- default_params:
- temperature: 0.1
- max_tokens: 4096
- timeout: 180
- cogvlm:
- name: "CogVLM2-19B"
- api_base: "http://localhost:11434/v1"
- api_key: ""
- model_id: "cogvlm2:19b"
- default_params:
- temperature: 0.1
- max_tokens: 4096
- timeout: 180
- # 提示词模板
- prompts:
- photo_analysis:
- name: "照片分析"
- template: |
- 请仔细观察这张照片,分析以下内容:
- 1. 照片的拍摄环境和背景
- 2. 人物的外貌特征和着装
- 3. 照片的拍摄时间推测(基于服装、环境等)
- 4. 照片的保存状况(是否有破损、褪色等)
- 5. 照片的历史价值和意义
-
- 请用中文详细描述,分条列出分析结果。
- ocr_standard:
- name: "标准OCR识别"
- template: |
- You are an AI assistant specialized in converting PDF images to Markdown format. Please follow these instructions for the conversion:
- 1. Text Processing:
- - Accurately recognize all text content in the PDF image without guessing or inferring.
- - Convert the recognized text into Markdown format.
- - Maintain the original document structure, including headings, paragraphs, lists, etc.
- - For financial amounts, use standard half-width characters (e.g., use "," for thousands separator and "." for decimal point)
- 2. Mathematical Formula Processing:
- - Convert all mathematical formulas to LaTeX format.
- - Enclose inline formulas with \( \). For example: This is an inline formula \( E = mc^2 \)
- - Enclose block formulas with \\[ \\]. For example: \[ \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \]
- 3. Table Processing:
- - Convert tables to HTML format.
- - Wrap the entire table with <table> and </table>.
- - For financial data in tables, ensure numbers use standard format with half-width commas and periods
- 4. Figure Handling:
- - Ignore figures content in the PDF image. Do not attempt to describe or convert images.
- 5. Output Format:
- - Ensure the output Markdown document has a clear structure with appropriate line breaks between elements.
- - For complex layouts, try to maintain the original document's structure and format as closely as possible.
- - Use standard ASCII characters for punctuation and numbers
- Please strictly follow these guidelines to ensure accuracy and consistency in the conversion.
- table_extract:
- name: "表格提取"
- template: |
- 请从这张图片中提取所有表格数据,要求:
-
- 1. **表格识别**:
- - 准确识别所有表格边界
- - 正确分辨表头和数据行
-
- 2. **数据提取**:
- - 逐行逐列提取所有数据
- - 保持数据的原始格式和精度
- - 特别注意数字、金额的准确性
-
- 3. **格式输出**:
- - 输出为HTML表格格式
- - 保持表格的原始结构
- - 使用标准的半角字符
-
- 4. **质量检查**:
- - 确保没有遗漏任何数据
- - 验证数字格式的正确性
- - 检查表格结构的完整性
- photo_restore_classroom:
- name: "照片修复(教室背景)"
- template: |
- 请对这张老照片进行全面修复和背景替换,具体要求如下:
-
- **修复要求**:
- 1. 去除所有折痕、裂痕、污渍和划痕
- 2. 补全缺失的细节,提升清晰度
- 3. 人物面貌务必保持不变,只进行修复不改变特征
- 4. 进行适度的彩色化处理
-
- **背景替换**:
- - 将现有的宿舍背景完全替换为教室场景
- - 后方是黑板(深绿色或深灰色黑板)
- - 前方是课桌(木质课桌,呈棕色)
- - 营造1980-1990年代大学教室的氛围
- - 保持照片的年代感和真实性
-
- **色彩方案**:
- - 人物肤色:健康自然的亚洲人肤色
- - 头发:自然黑色
- - 服装色彩:
- * 左一:米色或卡其色外套,绿色裤子
- * 左二:浅灰色工作服
- * 左三:深蓝色毛衣
- * 右一:深棕色或深绿色外套
- - 教室环境:
- * 黑板:深绿色,略有粉笔痕迹
- * 课桌:深棕色木质纹理
- * 整体光线:自然的教室照明
-
- **技术要求**:
- - 保持人物的相对位置和姿态不变
- - 确保新背景与人物的光影一致
- - 维持照片的复古质感和年代感
- - 背景过渡要自然,避免生硬的拼接感
-
- 请生成修复后的照片。
- photo_restore_advanced:
- name: "高级照片修复"
- template: |
- 作为专业的照片修复专家,请对这张珍贵的老照片进行全面修复:
-
- **第一步:损伤修复**
- - 识别并修复所有可见的折痕、裂痕、污渍
- - 去除表面划痕和磨损痕迹
- - 修复边缘破损和不平整部分
- - 消除照片上的灰尘和水渍
-
- **第二步:画质增强**
- - 提升整体清晰度和锐度
- - 增强对比度和层次感
- - 降噪处理,保持细节的同时减少颗粒感
- - 色温校正,消除黄褐色偏色
-
- **第三步:彩色化处理**
- 人物特征(从左到右):
- 1. 第一人:健康肤色,黑色头发,米色夹克,绿色裤子
- 2. 第二人:健康肤色,黑色头发,眼镜,浅色工作服
- 3. 第三人:健康肤色,黑色头发,深色毛衣
- 4. 第四人:健康肤色,黑色头发,深色外套
-
- **第四步:背景重构**
- - 移除原有宿舍背景
- - 替换为1980年代大学教室场景:
- * 后方:标准教室黑板(深绿色,有轻微粉笔使用痕迹)
- * 前方:传统木质课桌(深棕色,简约设计)
- * 侧面:教室墙面(浅色,符合当时建筑风格)
- * 照明:自然的教室光线,柔和均匀
-
- **质量标准**:
- - 人物面部特征100%保持原貌
- - 新背景与人物光影完美融合
- - 色彩自然协调,符合年代特征
- - 整体画面清晰,细节丰富
- - 保持照片的历史真实感
-
- 请生成高质量的修复照片。
- photo_colorize_classroom:
- name: "照片上色(教室版)"
- template: |
- 请为这张黑白老照片进行专业的彩色化处理,并调整背景:
-
- **彩色化标准**:
- 严格按照1980-1990年代中国大学生的真实色彩进行上色:
-
- 人物色彩:
- - 肤色:自然健康的东亚人肤色,偏暖但不过分红润
- - 头发:统一为自然黑色,略带光泽
- - 眼镜(第二人):深色镜框,透明镜片
-
- 服装色彩:
- - 左一:浅驼色或米色夹克,深绿色裤子
- - 左二:浅灰蓝色工装,内搭白色或米色衬衫
- - 左三:深蓝色或藏青色毛衣,下身深色裤子
- - 右一:深棕色或军绿色外套
-
- **背景改造**:
- 原背景(宿舍)→ 新背景(教室)
- - 后墙:标准教室黑板,深绿色,表面有自然的使用痕迹
- - 前景:木质课桌,深棕色,简洁的1980年代设计风格
- - 环境光:教室的自然照明,明亮但柔和
- - 整体氛围:营造温馨的校园学习环境
-
- **技术要求**:
- 1. 保持原有构图和人物姿态
- 2. 确保色彩过渡自然,无明显色块
- 3. 背景替换要无缝融合
- 4. 保持照片的年代质感
- 5. 色彩饱和度适中,避免过于鲜艳
-
- 请生成彩色化且背景更新的照片。
- simple_photo_fix:
- name: "简单照片修复"
- template: |
- 请帮我修复这张老照片:
-
- 1. 去除所有折痕、划痕、污渍
- 2. 提升清晰度和对比度
- 3. 进行彩色化处理(自然色彩)
- 4. 将背景改为教室场景:后面是黑板,前面是课桌
- 5. 保持人物面貌不变,只做修复和美化
- 6. 整体风格要符合1980年代大学生活
-
- 请生成修复后的彩色照片。
- # 默认配置
- default:
- model: "qwen2_vl"
- prompt: "photo_analysis"
- normalize_numbers: false
|