Log in

    Internetkijken

    Kling AI: Kuaishou's grote videogeneratiemodel is vergelijkbaar met Sora

    Kling AI is een groot model voor het genereren van video's, uitgebracht door Kuaishou, waarmee video's van maximaal 2 minuten kunnen worden gegenereerd. Het belangrijkste voordeel is dat Kuaishou's zelfontwikkelde 3D-expressie- en lichaamsreconstructietechnologie wordt gebruikt om uitdrukkingen en lichaamsbewegingen aan te sturen via een volledige lichaamsfoto van een personage. Kling AI is geschikt voor het genereren van scènes zoals video's van zingende en dansende personages en lange video's.

    ChatTTS: Tekst-naar-spraakmodel voor gespreksscenario's

    Overzicht Onlangs is een tekst-naar-spraak-model behoorlijk populair geworden: ChatTTS. Bovendien is dit model ontwikkeld door een klein team in China. concentreer op[…]

    GPT-4o: Gratis grote modellen met gemengde input en gemengde output

    De release van GPT-4o markeert een nieuwe mijlpaal in hybride input-output grote modellen, met rijkere en snellere gesprekken. Het gratis gebruik en de lagere API-kosten maken deze technologie voor meer mensen toegankelijk. Vergeleken met Gemini 1.5 Pro is GPT-4o superieur in gesprekservaring en bevordert het de ontwikkeling van robots en AIGC-applicaties. Deze vooruitgang vertegenwoordigt een belangrijke ontwikkeling op het gebied van generatieve AI, waardoor nieuwe mogelijkheden ontstaan op gebieden zoals mens-computerinteractie en het genereren van inhoud.

    Viggle AI: video's genereren met bestuurbare karakterbewegingen

    Modellen voor videogeneratie zoals Sora en Stable Video Dissfusion worden vaak geconfronteerd met het probleem dat ze de uitgevoerde video niet nauwkeurig kunnen controleren, vooral wat betreft karakterbewegingen. Het bestuurbare videomodel kan de acties van personages in de video nauwkeurig besturen via prompte woorden. Viggle AI kan, als het eerste video-3D-model met daadwerkelijke fysieke begripsmogelijkheden, de bewegingen van personages vrijelijk controleren en is ingebed in het Discord-platform. Deze bestuurbare videotechnologie zal de kosten van digitale menselijke producten aanzienlijk verlagen en gediversifieerde digitale menselijke videocreatie mogelijk maken.

    Google Gemini 1.5 Pro persoonlijke test: krachtig en kwetsbaar tegelijk

    Na het testen van het onlangs geüpgradede multimodale AI-model Gemini 1.5 Pro ontdekten gebruikers dat, hoewel het een uitgebreider invoertype ondersteunt, inclusief tekst, afbeeldingen, video's, bestanden en mappen, het redeneervermogen niet significant is verbeterd, vooral niet bij het onderscheiden van recht van fout. Bovendien duurt de verwerking van invoer van video's, bestanden en mappen lang en zijn er beperkingen bij het verwerken van grote hoeveelheden gegevens.

    Hot topics in februari 2024: Sora - Open AI's grote videogeneratiemodel

    Op 16 februari 2024 bracht Open AI zijn geavanceerde videogeneratiemodel uit, genaamd Sora, dat een interesse wekt die bijna vergelijkbaar is met die van GPT, dat nog niet beschikbaar is voor openbaar gebruik en Transformer- en diffusie-architecturen combineert voor high-fidelity videosimulaties TikTok demonstreert de mogelijkheden van Sora met onbewerkte video's van verschillende prompts, en geeft een voorproefje van de potentiële impact ervan op het snelgroeiende gebied van videogeneratie.

    Gemini 1.5 pro: Hoe aan te vragen

    Google Gemini1.5 pro overzicht Google Gemini1.5 pro op 15 februari 2024 […]

    Hot topics in januari 2024: palworld

    1. Google Trends: Vergelijk “AI”, “gpt”, “palworld” Dit is een screenshot van vandaag (31/01/2024). […]

    新版WordPress体验:用SAAS、低代码和无代码的方式构建网站

    2023年11月06日,Wordpress v6.4.2发布。 两天后,我迁移自己的博客到别的服务器上。之后顺 […]

    第一波AIGC创业团队解散了,AIGC还有戏吗?

    今天,有朋友分享了一篇文章,近期,最早做AIGC的独角兽企业Jasper,归零了。Jasper,基于GPT,相 […]



    copyright © www.lyustu.com alle rechten voorbehouden.
    Thema: TheMoon V3.0. Auteur: neo yang