Visual ChatGPTを試してみる

はじめに

Visual ChatGPT というChatGPT と一連の Visual Foundation Models を接続して、チャット中に画像を送受信できるようにするOSSがMicrosoftから公開されているので試してみました。

これはGPUではなくCPUだけで処理できるようです。一連の流れは下記の通りですが、Anacondaのインストールが必要になります。

: GitHub - chenfei-wu/TaskMatrix

Contribute to chenfei-wu/TaskMatrix development by creating an account on GitHub.

github.com

インストール

Anacondaのインストール

最初にPython環境を整えるためにAnacondaのインストールを行います。これはPython 3.8が利用できればpynevでも問題ないと思います。

apt update
apt upgrade
wget https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh
chmod +x Anaconda3-2022.10-Linux-x86_64.sh
./Anaconda3-2022.10-Linux-x86_64.sh
source .bashrc

以上でインストールを完了します。

Visual ChatGPTのインストール

コードをダウンロードしてきます。

Pythonをインストールします。

git clone https://github.com/microsoft/visual-chatgpt.git
cd visual-chatgpt
conda create -n visgpt python=3.8
conda activate visgpt
pip install -r requirements.txt

apt install libgl1-mesa-dev

実行

OpenAIのAPIを設定します。

export OPENAI_API_KEY=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

CPUで実行します。

python visual_chatgpt.py --load ImageCaptioning_cpu,Text2Image_cpu

あとはアクセスします。

何か入力してあげます。下記ではcatと入力しています。

ネコ

なにしろCPUだと遅いのでAzureで一番コア数が多いもので試しました。96 vCPUです。

動かなかったです。

Yes
Action: Generate Image From User Input Text
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [01:49<00:00, 2.19s/it]
Segmentation fault (core dumped)

月	火	水	木	金	土	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31