收集全球10,000⁺个好用的AI软件
-
vision-parsevision-parse是一个利用视觉语言模型(Vision LLMs)将PDF文档解析为格式化良好的Markdown内容的工具。它支持多种模型,包括...
-
CheXagentCheXagent是一个基于视觉语言基础模型的胸部X光解读工具。它利用临床大型语言模型来解析放射学报告,视觉编码器用于表示X光图像,并设计了一个网络来...
-
视觉语言模型是什么意思?视觉语言模型(Vision-Language Models, VLMs)详细介绍视觉语言模型(Vision-Language Models, VLMs)是一类多模态模型,它们能够同时从图像和文本中学习,以处理多种任务,例如视觉...