ما هو VisualGPT – كل ما تحتاج إلى معرفته

Ma Hw Visualgpt Kl Ma Thtaj Aly M Rfth



تطلق Microsoft VisualGPT تقنية جديدة ' VisualGPT 'يعد هذا تقدمًا في الذكاء الاصطناعي ويفتح الإمكانيات لتجارب ذكاء اصطناعي أكثر جاذبية وتفاعلية من خلال سد الفجوة بين العناصر المرئية واللغة.

ما هو فيجوال جي بي تي؟

VisualGPT هو إصدار موسع من ChatGPT يعتمد على نماذج NLP (معالجة اللغات الطبيعية)، ولكن في VisualGPT، يتم استخدام VFMS والذي يمكنه تحويل الاستعلامات النصية إلى نموذج صورة. إنه عبارة عن مزيج/تكامل بين استعلامات النص والصور.







الغرض من VisualGPT

بعد طرح ChatGPT في السوق والذي كان يعمل على التنسيق النصي باعتباره الوحيد، لتحقيق المستوى التالي من التقدم، توجد الأداة المثالية التي ستعمل على التنسيق النصي إلى التنسيق الرسومي، باتباع كل هذه الأسباب وفي السباق نحو الذكاء الاصطناعي تقدم Microsoft إصدارات VisualGPT والغرض الرئيسي من VisualGPT هو إنشاء صور AI بناءً على طلب المستخدم أو تحليل الصورة



بنية VisualGPT

يحتوي VisualGPT على استعلام المستخدم، ومدير المطالبة، ونماذج الأساس المرئي (VFMs)، ومبدأ النظام، وتاريخ الحوار، وتاريخ الاستدلال، والإجابة المتوسطة.



إذا تحدثنا على وجه التحديد عن نموذجها أي ' VFMs (نماذج الأساس البصري) '، يتم استخدام ما يقرب من 22 VFM، مثل BLIP (التدريب المسبق على لغة Bootstrapping Language-Image)، وStable Diffusion.





كيفية تشغيل ChatGPT المرئي؟

لتشغيل Visual ChatGPT، خذ بعين الاعتبار الخطوات التالية:

الخطوة 1: خلق بيئة

أولاً، تحتاج إلى إنشاء بيئة Python الإصدار 3.8:



نظام الاستيراد

sys.path.append ( '/usr/local/lib/python3.8/site-packages' )

الخطوة 2: استنساخ ملف ChatGPT المرئي

الآن، انسخ ملف ChatGPT المرئي من GitHub باستخدام الأمر التالي:

! gitclone https: // github.com / Deepanshu88 / visual-chatgpt.git

الخطوة 3: إعداد دليل جديد

بعد ذلك، قم بإعداد دليل جديد عبر الأمر المذكور أدناه:

% قرص مضغوط visual-chatgpt

الخطوة 4: تثبيت الحزم المطلوبة

الآن قم بتثبيت الحزم المطلوبة باستخدام ' نقطة 'أمر cmdlet:

! حليقة https: // bootstrap.pypa.io / get-pip.py get-pip.py

! python3.8 get-pip.py

! بيثون3.8 نقطة ثَبَّتَ المتطلبات.txt

الخطوة 5: الوصول إلى OpenAI API

بعد تثبيت الحزم الأولية، قم بالوصول إلى OpenAI API عن طريق الحصول على مفتاح API من 'platform.openai.com' وإجراء استدعاءات API مصادق عليها:

% بيئة OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

الخطوة 6: اختر النموذج

أخيرًا، بعد الوصول إلى Openai، اختر النموذج، هناك أكثر من 20 نموذجًا يتم استخدامها في visualGPT يمكنك اختيارها وفقًا لمتطلباتك:

! بيثون3.8. / visual_chatgpt.py --حمولة Text2Image_cuda: 0

في الأمر أعلاه ' Text2Image ' يتوافق مع النموذج الذي سيتم استخدامه. لمزيد من التفاصيل تحقق من Google Colab دفتر .

خاتمة

تم تقديم ChatGPT للحصول على إجابات محددة حول أي استفسار، والآن أطلقت Microsoft VisualGPT القادر على التعامل مع البيانات النصية وكذلك البيانات المصورة. بحيث يمكن للمستخدم ببساطة إضافة متطلباته في شكل نصي والحصول على مخرجاته الرسومية.