はじめに
Visual ChatGPT というChatGPT と一連の Visual Foundation Models を接続して、チャット中に画像を送受信できるようにするOSSがMicrosoftから公開されているので試してみました。
これはGPUではなくCPUだけで処理できるようです。一連の流れは下記の通りですが、Anacondaのインストールが必要になります。
-
GitHub - chenfei-wu/TaskMatrix
Contribute to chenfei-wu/TaskMatrix development by creating an account on GitHub.
github.com
インストール
Anacondaのインストール
最初にPython環境を整えるためにAnacondaのインストールを行います。これはPython 3.8が利用できればpynevでも問題ないと思います。
apt update
apt upgrade
wget https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh
chmod +x Anaconda3-2022.10-Linux-x86_64.sh
./Anaconda3-2022.10-Linux-x86_64.sh
source .bashrc
以上でインストールを完了します。
Visual ChatGPTのインストール
コードをダウンロードしてきます。
Pythonをインストールします。
git clone https://github.com/microsoft/visual-chatgpt.git
cd visual-chatgpt
conda create -n visgpt python=3.8
conda activate visgpt
pip install -r requirements.txt
apt install libgl1-mesa-dev
実行
OpenAIのAPIを設定します。
export OPENAI_API_KEY=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
CPUで実行します。
python visual_chatgpt.py --load ImageCaptioning_cpu,Text2Image_cpu
あとはアクセスします。
何か入力してあげます。下記ではcatと入力しています。
ネコ
なにしろCPUだと遅いのでAzureで一番コア数が多いもので試しました。96 vCPUです。
動かなかったです。
Yes
Action: Generate Image From User Input Text
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [01:49<00:00, 2.19s/it]
Segmentation fault (core dumped)