تسجيل الدخول

    مراقبة الإنترنت

    Kling AI: نموذج إنشاء الفيديو الكبير من Kuaishou يشبه Sora

    Kling AI هو نموذج كبير لتوليد الفيديو تم إصداره بواسطة Kuaishou، ويمكنه إنشاء مقاطع فيديو تصل مدتها إلى دقيقتين. وتتمثل ميزتها الرئيسية في استخدام تقنية التعبير ثلاثي الأبعاد وإعادة بناء الجسم التي طورتها شركة Kuaishou ذاتيًا لدفع التعبيرات وحركات الجسم من خلال صورة لكامل الجسم للشخصية. يعد Kling AI مناسبًا لإنشاء مشاهد مثل مقاطع فيديو لشخصيات تغني وترقص ومقاطع فيديو طويلة.

    ChatTTS: نموذج تحويل النص إلى كلام لسيناريوهات المحادثة

    نظرة عامة في الآونة الأخيرة، أصبح نموذج تحويل النص إلى كلام شائعًا جدًا: ChatTTS. علاوة على ذلك، تم تطوير هذا النموذج من قبل فريق صغير في الصين. قم بالتركيز على[…]

    GPT-4o: نماذج كبيرة مجانية ذات مدخلات ومخرجات مختلطة

    يمثل إصدار GPT-4o علامة فارقة جديدة في النماذج الكبيرة ذات المدخلات والمخرجات الهجينة، مع محادثات أكثر ثراءً وأسرع. إن الاستخدام المجاني ورسوم واجهة برمجة التطبيقات المخفضة تجعل هذه التكنولوجيا في متناول عدد أكبر من الأشخاص. بالمقارنة مع Gemini1.5 Pro، فإن GPT-4o متفوق في تجربة المحادثة، مما يعزز تطوير الروبوتات وتطبيقات AIGC. يمثل هذا التقدم تطورًا مهمًا في مجال الذكاء الاصطناعي التوليدي، مما يوفر إمكانيات جديدة لمجالات مثل التفاعل بين الإنسان والحاسوب وتوليد المحتوى.

    Viggle AI: كيفية إنشاء مقاطع فيديو بحركات شخصية يمكن التحكم فيها

    غالبًا ما تواجه نماذج إنشاء الفيديو مثل Sora وStable Video Dissfusion مشكلة عدم القدرة على التحكم بدقة في إخراج الفيديو، خاصة في حركات الشخصيات. يمكن لنموذج الفيديو الذي يمكن التحكم فيه التحكم بدقة في تصرفات الشخصيات في الفيديو من خلال الكلمات السريعة. يمكن لـ Viggle AI، باعتباره أول نموذج فيديو ثلاثي الأبعاد يتمتع بقدرات فهم جسدية فعلية، التحكم بحرية في حركات الشخصية وهو مضمن في منصة Discord. ستعمل تقنية الفيديو القابلة للتحكم هذه على تقليل تكلفة المنتجات البشرية الرقمية بشكل كبير وتمكين إنشاء فيديو بشري رقمي متنوع.

    اختبار Google Gemini 1.5 Pro الشخصي: قوي وهش في نفس الوقت

    بعد اختبار نموذج الذكاء الاصطناعي متعدد الوسائط Gemini 1.5 Pro الذي تمت ترقيته حديثًا، وجد المستخدمون أنه على الرغم من أنه يدعم نوع إدخال أكثر شمولاً بما في ذلك النصوص والصور ومقاطع الفيديو والملفات والمجلدات، إلا أن القدرة على التفكير لم تتحسن بشكل ملحوظ، خاصة في التمييز الصحيح من الآخر. خطأ. بالإضافة إلى ذلك، تستغرق معالجة مدخلات الفيديو والملفات والمجلدات وقتًا طويلاً، كما توجد قيود في التعامل مع كميات كبيرة من البيانات.

    المواضيع الساخنة في فبراير 2024: Sora - نموذج إنشاء الفيديو الكبير الخاص بـ Open AI

    في 16 فبراير 2024، أصدرت Open AI نموذجها المتقدم لتوليد الفيديو المسمى Sora، مما أثار اهتمامًا ينافس تقريبًا اهتمام GPT. يجمع Sora، الذي لم يكن متاحًا للاستخدام العام بعد، بين بنيات المحولات والانتشار لمحاكاة الفيديو عالية الدقة. يعرض TikTok قدرات Sora من خلال مقاطع فيديو غير محررة من مطالبات مختلفة، مع معاينة تأثيرها المحتمل في مجال إنشاء الفيديو المزدهر.

    الجوزاء 1.5 برو: كيفية التقديم

    نظرة عامة على Google Gemini1.5 pro Google Gemini1.5 pro في 15 فبراير 2024 […]

    مواضيع ساخنة في يناير 2024: palworld

    1. مؤشرات Google: قارن "AI"، "gpt"، "palworld" هذه لقطة شاشة من اليوم (2024/01/31). […]

    تجربة WordPress الجديدة: إنشاء مواقع ويب باستخدام SAAS، ذات التعليمات البرمجية المنخفضة وبدون تعليمات برمجية

    في 6 نوفمبر 2023، تم إصدار الإصدار 6.4.2 من WordPress. وبعد يومين، قمت بنقل مدونتي إلى خادم آخر. لاحقاً […]

    لقد تم حل الموجة الأولى من فرق ريادة الأعمال في AIGC، فهل لا يزال هناك مستقبل لـ AIGC؟

    اليوم، شارك أحد الأصدقاء مقالًا، مؤخرًا، عادت Jasper، أول شركة يونيكورن تقوم بتنفيذ AIGC، إلى الصفر. جاسبر، استنادا إلى GPT، هو […]



    حقوق الطبع والنشر © www.lyustu.com جميع الحقوق محفوظة.
    الموضوع: TheMoon V3.0 الكاتب:نيو يانغ