뉴스 보도 Technology
2023 년 3 월 22 일

텍스트 투 비디오 모델 Gen-2는 텍스트 프롬프트를 사용하여 짧은 비디오를 생성할 수 있습니다.

요컨대

RunWayML의 새로운 Text2Video 모델 Gen-2는 기존 편집뿐만 아니라 동영상 또한 텍스트 프롬프트만 사용하여 처음부터 새 항목을 생성할 수도 있습니다.

이 기능은 사람들이 소셜 미디어 플랫폼에서 콘텐츠를 만들고 공유하는 방식을 개선하여 사용자가 정적인 이미지를 동적으로 비디오 편집에 대한 사전 지식 없이도 비디오 클립을 매력적으로 만들 수 있습니다.

Runway의 새로운 텍스트-비디오 모델 Gen-2는 기존 비디오를 편집할 수 있을 뿐만 아니라 텍스트 프롬프트만 사용하여 처음부터 새로운 비디오를 생성할 수 있습니다. 이는 기존 비디오만 편집할 수 있었던 이전 버전의 Gen에 비해 크게 개선된 것입니다. 텍스트 투 비디오 모델인 Gen-2는 Runway의 최첨단 AI 기술을 활용하여 사람이 만든 것과 구별할 수 없는 비디오를 만듭니다. 이 새로운 기능을 사용하면 광범위한 비디오 편집 기술 없이도 비디오를 자동으로 생성하여 시간과 노력을 절약할 수 있습니다.

텍스트 투 비디오 모델 Gen-2는 텍스트 프롬프트를 사용하여 짧은 비디오를 생성할 수 있습니다.

새로운 Gen-2 모델은 업로드된 이미지를 간략한 비디오 클립. 이는 사용자가 원하는 비디오를 설명하는 텍스트 힌트를 제공하여 수행됩니다. 지금까지 동영상의 재생 시간은 몇 초를 넘지 않지만 품질은 이미 경쟁사보다 훨씬 높습니다(특히 경쟁사의 신경망 공개적으로 사용할 수 없음). 이 기능은 사람들이 소셜 미디어 플랫폼에서 콘텐츠를 만들고 공유하는 방법을 개선할 것으로 예상됩니다. Gen-2 모델을 사용하여 사용자는 정적 이미지를 동적 비디오 클립으로 쉽게 변환할 수 있습니다. Facebook이나 Tiktok이 이 기술을 사용하여 콘텐츠 제작자가 사용할 수 있는 AI 도구 세트를 확장할 가능성이 높습니다.

AI 비디오 경쟁은 치열합니다. Gen-1이 출시된 지 불과 일주일이 지났고 Gen-2는 이미 출시되었습니다. 최첨단 AI 영상 기술을 개발하기 위한 기술 기업 간의 경쟁이 급속도로 치열해지고 있으며, 각 기업은 서로를 능가하기 위해 노력하고 있습니다.

Gen의 새 버전을 사용하려면 다음 페이지에서 대기열에 등록해야 합니다. 런웨이 웹사이트.

  • 인공지능 스타트업 런웨이, 1세대 발표, 프롬프트와 이미지를 결합하여 오래된 비디오를 새로운 비디오로 바꿀 수 있는 신경망. Gen-1은 영화 제작자가 이미지 또는 텍스트 프롬프트 소스 비디오의 구조에. Runway Research는 새로운 형태의 창의성을 가능하게 하는 다중 모드 AI 시스템 구축에 전념하고 있으며 Gen-1을 사용하여 스토리텔링의 미래를 실험할 수 있습니다.
  • 지난 달 공동 설립자이자 CEO인 Sam Altman은 OpenAI, 최근 TechCrunch와의 인터뷰에서 OpenAI 개발 중 비디오용 AI 모델GPT-4, 회사가 신뢰성과 보안을 확인한 후 대중에게 공개됩니다.
  • 지난 XNUMX월, 구글은 일련의 비디오를 기반으로 텍스트 조건부 비디오를 생성하는 방법인 Imagen Video를 개발했습니다. 확산 모델. 시스템은 텍스트 설명을 받아들이고 16x24픽셀의 해상도로 초당 48프레임으로 128프레임 동영상을 생성합니다. 시스템은 추가 프레임을 확장하고 "예측"하여 초당 24프레임 및 720p 해상도(1280×768)에서 14프레임의 최종 비디오를 생성합니다. Imagen Video를 교육하는 데 XNUMX천만 개의 이미지-텍스트 쌍과 XNUMX만 개의 비디오-텍스트 쌍이 사용되었습니다.

더 많은 관련 기사 읽기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

Ripple에서 Big Green DAO까지: 암호화폐 프로젝트가 자선 활동에 기여하는 방법

자선 활동을 위해 디지털 통화의 잠재력을 활용하는 이니셔티브를 살펴보겠습니다.

현장 사진

AlphaFold 3, Med-Gemini 등: 2024년 AI가 의료를 혁신하는 방식

AI는 새로운 유전적 상관관계를 밝히는 것부터 로봇 수술 시스템을 강화하는 것까지 의료 분야에서 다양한 방식으로 나타납니다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Ripple에서 Big Green DAO까지: 암호화폐 프로젝트가 자선 활동에 기여하는 방법
Analysis Crypto Wiki 근무지에서 발생 교육 생활 시장 소프트웨어 Technology
Ripple에서 Big Green DAO까지: 암호화폐 프로젝트가 자선 활동에 기여하는 방법
2024 년 5 월 13 일
AlphaFold 3, Med-Gemini 등: 2024년 AI가 의료를 혁신하는 방식
AI Wiki Analysis 요람 의견 근무지에서 발생 시장 뉴스 보도 소프트웨어 이야기와 리뷰 Technology
AlphaFold 3, Med-Gemini 등: 2024년 AI가 의료를 혁신하는 방식
2024 년 5 월 13 일
Nim Network는 AI 소유권 토큰화 프레임워크를 출시하고 5월로 예정된 스냅샷 날짜로 수익 판매를 실시합니다.
시장 뉴스 보도 Technology
Nim Network는 AI 소유권 토큰화 프레임워크를 출시하고 5월로 예정된 스냅샷 날짜로 수익 판매를 실시합니다.
2024 년 5 월 13 일
바이낸스는 아르헨티나와 협력하여 사이버 범죄에 맞서 싸우고 있습니다.
의견 근무지에서 발생 시장 뉴스 보도 소프트웨어 Technology
바이낸스는 아르헨티나와 협력하여 사이버 범죄에 맞서 싸우고 있습니다.
2024 년 5 월 13 일
CRYPTOMERIA LABS PTE. LTD.