Grote veranderingen in het gedrag van internetgebruikers

Flowdrager en bamboemand om water te zuigen

Bij e-commerce draait alles om verkeer en conversie - een overzicht en samenvatting van de ontwikkeling van e-commerce

Over het ontstaan van cirkels - snel mensen verzamelen en nauwkeurige realisatie

Documentgebaseerd WEB en applicatiegebaseerd WEB

Internetkijken

Kling AI: Kuaishou's grote videogeneratiemodel is vergelijkbaar met Sora

Kling AI is een groot model voor het genereren van video's, uitgebracht door Kuaishou, waarmee video's van maximaal 2 minuten kunnen worden gegenereerd. Het belangrijkste voordeel is dat Kuaishou's zelfontwikkelde 3D-expressie- en lichaamsreconstructietechnologie wordt gebruikt om uitdrukkingen en lichaamsbewegingen aan te sturen via een volledige lichaamsfoto van een personage. Kling AI is geschikt voor het genereren van scènes zoals video's van zingende en dansende personages en lange video's.

InternetkijkenAuteur:neo yang

ChatTTS: Tekst-naar-spraakmodel voor gespreksscenario's

Overzicht Onlangs is een tekst-naar-spraak-model behoorlijk populair geworden: ChatTTS. Bovendien is dit model ontwikkeld door een klein team in China. concentreer op[…]

InternetkijkenAuteur:neo yang

GPT-4o: Gratis grote modellen met gemengde input en gemengde output

De release van GPT-4o markeert een nieuwe mijlpaal in hybride input-output grote modellen, met rijkere en snellere gesprekken. Het gratis gebruik en de lagere API-kosten maken deze technologie voor meer mensen toegankelijk. Vergeleken met Gemini 1.5 Pro is GPT-4o superieur in gesprekservaring en bevordert het de ontwikkeling van robots en AIGC-applicaties. Deze vooruitgang vertegenwoordigt een belangrijke ontwikkeling op het gebied van generatieve AI, waardoor nieuwe mogelijkheden ontstaan op gebieden zoals mens-computerinteractie en het genereren van inhoud.

InternetkijkenAuteur:neo yang

Viggle AI: video's genereren met bestuurbare karakterbewegingen

Modellen voor videogeneratie zoals Sora en Stable Video Dissfusion worden vaak geconfronteerd met het probleem dat ze de uitgevoerde video niet nauwkeurig kunnen controleren, vooral wat betreft karakterbewegingen. Het bestuurbare videomodel kan de acties van personages in de video nauwkeurig besturen via prompte woorden. Viggle AI kan, als het eerste video-3D-model met daadwerkelijke fysieke begripsmogelijkheden, de bewegingen van personages vrijelijk controleren en is ingebed in het Discord-platform. Deze bestuurbare videotechnologie zal de kosten van digitale menselijke producten aanzienlijk verlagen en gediversifieerde digitale menselijke videocreatie mogelijk maken.

InternetkijkenAuteur:neo yang

Google Gemini 1.5 Pro persoonlijke test: krachtig en kwetsbaar tegelijk

Na het testen van het onlangs geüpgradede multimodale AI-model Gemini 1.5 Pro ontdekten gebruikers dat, hoewel het een uitgebreider invoertype ondersteunt, inclusief tekst, afbeeldingen, video's, bestanden en mappen, het redeneervermogen niet significant is verbeterd, vooral niet bij het onderscheiden van recht van fout. Bovendien duurt de verwerking van invoer van video's, bestanden en mappen lang en zijn er beperkingen bij het verwerken van grote hoeveelheden gegevens.

InternetkijkenAuteur:neo yang

Hot topics in februari 2024: Sora - Open AI's grote videogeneratiemodel

Op 16 februari 2024 bracht Open AI zijn geavanceerde videogeneratiemodel uit, genaamd Sora, dat een interesse wekt die bijna vergelijkbaar is met die van GPT, dat nog niet beschikbaar is voor openbaar gebruik en Transformer- en diffusie-architecturen combineert voor high-fidelity videosimulaties TikTok demonstreert de mogelijkheden van Sora met onbewerkte video's van verschillende prompts, en geeft een voorproefje van de potentiële impact ervan op het snelgroeiende gebied van videogeneratie.

InternetkijkenAuteur:neo yang