config.yaml 8.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235
  1. # 本地大模型配置文件
  2. models:
  3. qwen2_vl:
  4. name: "Qwen2.5-VL-72B-Instruct-AWQ"
  5. api_base: "http://10.192.72.12:9991/v1"
  6. api_key: "${YUSYS_MULTIMODAL_API_KEY}"
  7. model_id: "Qwen2.5-VL-72B-Instruct-AWQ"
  8. default_params:
  9. temperature: 0.1
  10. max_tokens: 4096
  11. timeout: 180
  12. llava:
  13. name: "LLaVA-v1.6-34B"
  14. api_base: "http://localhost:11434/v1"
  15. api_key: ""
  16. model_id: "llava:34b"
  17. default_params:
  18. temperature: 0.1
  19. max_tokens: 4096
  20. timeout: 180
  21. cogvlm:
  22. name: "CogVLM2-19B"
  23. api_base: "http://localhost:11434/v1"
  24. api_key: ""
  25. model_id: "cogvlm2:19b"
  26. default_params:
  27. temperature: 0.1
  28. max_tokens: 4096
  29. timeout: 180
  30. # 提示词模板
  31. prompts:
  32. photo_analysis:
  33. name: "照片分析"
  34. template: |
  35. 请仔细观察这张照片,分析以下内容:
  36. 1. 照片的拍摄环境和背景
  37. 2. 人物的外貌特征和着装
  38. 3. 照片的拍摄时间推测(基于服装、环境等)
  39. 4. 照片的保存状况(是否有破损、褪色等)
  40. 5. 照片的历史价值和意义
  41. 请用中文详细描述,分条列出分析结果。
  42. ocr_standard:
  43. name: "标准OCR识别"
  44. template: |
  45. You are an AI assistant specialized in converting PDF images to Markdown format. Please follow these instructions for the conversion:
  46. 1. Text Processing:
  47. - Accurately recognize all text content in the PDF image without guessing or inferring.
  48. - Convert the recognized text into Markdown format.
  49. - Maintain the original document structure, including headings, paragraphs, lists, etc.
  50. - For financial amounts, use standard half-width characters (e.g., use "," for thousands separator and "." for decimal point)
  51. 2. Mathematical Formula Processing:
  52. - Convert all mathematical formulas to LaTeX format.
  53. - Enclose inline formulas with \( \). For example: This is an inline formula \( E = mc^2 \)
  54. - Enclose block formulas with \\[ \\]. For example: \[ \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \]
  55. 3. Table Processing:
  56. - Convert tables to HTML format.
  57. - Wrap the entire table with <table> and </table>.
  58. - For financial data in tables, ensure numbers use standard format with half-width commas and periods
  59. 4. Figure Handling:
  60. - Ignore figures content in the PDF image. Do not attempt to describe or convert images.
  61. 5. Output Format:
  62. - Ensure the output Markdown document has a clear structure with appropriate line breaks between elements.
  63. - For complex layouts, try to maintain the original document's structure and format as closely as possible.
  64. - Use standard ASCII characters for punctuation and numbers
  65. Please strictly follow these guidelines to ensure accuracy and consistency in the conversion.
  66. table_extract:
  67. name: "表格提取"
  68. template: |
  69. 请从这张图片中提取所有表格数据,要求:
  70. 1. **表格识别**:
  71. - 准确识别所有表格边界
  72. - 正确分辨表头和数据行
  73. 2. **数据提取**:
  74. - 逐行逐列提取所有数据
  75. - 保持数据的原始格式和精度
  76. - 特别注意数字、金额的准确性
  77. 3. **格式输出**:
  78. - 输出为HTML表格格式
  79. - 保持表格的原始结构
  80. - 使用标准的半角字符
  81. 4. **质量检查**:
  82. - 确保没有遗漏任何数据
  83. - 验证数字格式的正确性
  84. - 检查表格结构的完整性
  85. photo_restore_classroom:
  86. name: "照片修复(教室背景)"
  87. template: |
  88. 请对这张老照片进行全面修复和背景替换,具体要求如下:
  89. **修复要求**:
  90. 1. 去除所有折痕、裂痕、污渍和划痕
  91. 2. 补全缺失的细节,提升清晰度
  92. 3. 人物面貌务必保持不变,只进行修复不改变特征
  93. 4. 进行适度的彩色化处理
  94. **背景替换**:
  95. - 将现有的宿舍背景完全替换为教室场景
  96. - 后方是黑板(深绿色或深灰色黑板)
  97. - 前方是课桌(木质课桌,呈棕色)
  98. - 营造1980-1990年代大学教室的氛围
  99. - 保持照片的年代感和真实性
  100. **色彩方案**:
  101. - 人物肤色:健康自然的亚洲人肤色
  102. - 头发:自然黑色
  103. - 服装色彩:
  104. * 左一:米色或卡其色外套,绿色裤子
  105. * 左二:浅灰色工作服
  106. * 左三:深蓝色毛衣
  107. * 右一:深棕色或深绿色外套
  108. - 教室环境:
  109. * 黑板:深绿色,略有粉笔痕迹
  110. * 课桌:深棕色木质纹理
  111. * 整体光线:自然的教室照明
  112. **技术要求**:
  113. - 保持人物的相对位置和姿态不变
  114. - 确保新背景与人物的光影一致
  115. - 维持照片的复古质感和年代感
  116. - 背景过渡要自然,避免生硬的拼接感
  117. 请生成修复后的照片。
  118. photo_restore_advanced:
  119. name: "高级照片修复"
  120. template: |
  121. 作为专业的照片修复专家,请对这张珍贵的老照片进行全面修复:
  122. **第一步:损伤修复**
  123. - 识别并修复所有可见的折痕、裂痕、污渍
  124. - 去除表面划痕和磨损痕迹
  125. - 修复边缘破损和不平整部分
  126. - 消除照片上的灰尘和水渍
  127. **第二步:画质增强**
  128. - 提升整体清晰度和锐度
  129. - 增强对比度和层次感
  130. - 降噪处理,保持细节的同时减少颗粒感
  131. - 色温校正,消除黄褐色偏色
  132. **第三步:彩色化处理**
  133. 人物特征(从左到右):
  134. 1. 第一人:健康肤色,黑色头发,米色夹克,绿色裤子
  135. 2. 第二人:健康肤色,黑色头发,眼镜,浅色工作服
  136. 3. 第三人:健康肤色,黑色头发,深色毛衣
  137. 4. 第四人:健康肤色,黑色头发,深色外套
  138. **第四步:背景重构**
  139. - 移除原有宿舍背景
  140. - 替换为1980年代大学教室场景:
  141. * 后方:标准教室黑板(深绿色,有轻微粉笔使用痕迹)
  142. * 前方:传统木质课桌(深棕色,简约设计)
  143. * 侧面:教室墙面(浅色,符合当时建筑风格)
  144. * 照明:自然的教室光线,柔和均匀
  145. **质量标准**:
  146. - 人物面部特征100%保持原貌
  147. - 新背景与人物光影完美融合
  148. - 色彩自然协调,符合年代特征
  149. - 整体画面清晰,细节丰富
  150. - 保持照片的历史真实感
  151. 请生成高质量的修复照片。
  152. photo_colorize_classroom:
  153. name: "照片上色(教室版)"
  154. template: |
  155. 请为这张黑白老照片进行专业的彩色化处理,并调整背景:
  156. **彩色化标准**:
  157. 严格按照1980-1990年代中国大学生的真实色彩进行上色:
  158. 人物色彩:
  159. - 肤色:自然健康的东亚人肤色,偏暖但不过分红润
  160. - 头发:统一为自然黑色,略带光泽
  161. - 眼镜(第二人):深色镜框,透明镜片
  162. 服装色彩:
  163. - 左一:浅驼色或米色夹克,深绿色裤子
  164. - 左二:浅灰蓝色工装,内搭白色或米色衬衫
  165. - 左三:深蓝色或藏青色毛衣,下身深色裤子
  166. - 右一:深棕色或军绿色外套
  167. **背景改造**:
  168. 原背景(宿舍)→ 新背景(教室)
  169. - 后墙:标准教室黑板,深绿色,表面有自然的使用痕迹
  170. - 前景:木质课桌,深棕色,简洁的1980年代设计风格
  171. - 环境光:教室的自然照明,明亮但柔和
  172. - 整体氛围:营造温馨的校园学习环境
  173. **技术要求**:
  174. 1. 保持原有构图和人物姿态
  175. 2. 确保色彩过渡自然,无明显色块
  176. 3. 背景替换要无缝融合
  177. 4. 保持照片的年代质感
  178. 5. 色彩饱和度适中,避免过于鲜艳
  179. 请生成彩色化且背景更新的照片。
  180. simple_photo_fix:
  181. name: "简单照片修复"
  182. template: |
  183. 请帮我修复这张老照片:
  184. 1. 去除所有折痕、划痕、污渍
  185. 2. 提升清晰度和对比度
  186. 3. 进行彩色化处理(自然色彩)
  187. 4. 将背景改为教室场景:后面是黑板,前面是课桌
  188. 5. 保持人物面貌不变,只做修复和美化
  189. 6. 整体风格要符合1980年代大学生活
  190. 请生成修复后的彩色照片。
  191. # 默认配置
  192. default:
  193. model: "qwen2_vl"
  194. prompt: "photo_analysis"
  195. normalize_numbers: false