Qwen-VL-Chat使用教程
Qwen-VL-Chat是通用多模态大规模语言模型,因此它可以完成多种视觉语言任务。在本教程之中,我们会给出一些简明的例子,用以展示Qwen-VL-Chat在**视觉问答,文字理解,图表数学推理,多图理解和Grounding**(根据指令标注图片中指定区域的包围框)等多方面的能力。请注意,展示的例子远非Qwen-VL-Chat能力的极限,**您可以通过更换不同的输入图像和提示词(Prompt),来进一步挖掘Qwen-VL-Chat的能力!**
Explore
4,151 skills indexed with the new KISS metadata standard.
Qwen-VL-Chat是通用多模态大规模语言模型,因此它可以完成多种视觉语言任务。在本教程之中,我们会给出一些简明的例子,用以展示Qwen-VL-Chat在**视觉问答,文字理解,图表数学推理,多图理解和Grounding**(根据指令标注图片中指定区域的包围框)等多方面的能力。请注意,展示的例子远非Qwen-VL-Chat能力的极限,**您可以通过更换不同的输入图像和提示词(Prompt),来进一步挖掘Qwen-VL-Chat的能力!**
<a href="README_CN.md">中文</a>  |  English   |  <a href="README_JA.md">日本語</a> |  <a href="README_KO.md">한국어</a> 
中文</a>  |  <a href="README.md">English</a>   |  <a href="README_JA.md">日本語</a> |  <a href="README_KO.md">한국어</a> 
<a href="README_CN.md">中文</a>  |   <a href="README.md">English</a>  |  日本語 
4.31.0 is preferred.
4.31.0 が望ましいです。
4.31.0 버전을 사용하는 것을 선호합니다.
建议使用4.31.0。
*.so
docker build -t qwen-vl-chat:webdemo --platform linux/amd64 -f Dockerfile.qwendemo .
<div align="center">
ignore = E501, F403, C901, W504, W605, E251, E122, E126, E127, E722, W503, E128, E741, E731, E701
__pycache__/
repos:
- Clone this repository:
<div align="center">
📗 [中文版README](./README_zh.md)
📗 [README in English](./README.md)
CogVLM-SFT-311K is the primary aligned corpus used in the initial training of CogVLM v1.0. The process of constructing this dataset is as follows:
CogVLM-SFT-311K 是我们在训练 **CogVLM v1.0** 最初版本时使用的主要对齐语料库。此数据集的构建过程如下:
LOCAL_WORLD_SIZE=8
__pycache__
build:
.git