阿里巴巴研發(fā)中文語(yǔ)言數(shù)據(jù)集 Youku-mPLUG,語(yǔ)料數(shù)據(jù)來(lái)自優(yōu)酷 興趣認(rèn)證 |
發(fā)布時(shí)間:2023-06-09 文章來(lái)源:本站 瀏覽次數(shù):1892 |
6月8日訊,據(jù) arxiv上的一篇論文顯示,達(dá)摩院近來(lái)為了推進(jìn)視覺(jué)言語(yǔ)預(yù)練習(xí)以及多模態(tài)大言語(yǔ)模型在中文社區(qū)的發(fā)展,發(fā)布了一款視頻言語(yǔ)數(shù)據(jù)集 Youku-mPLUG。 這個(gè)數(shù)據(jù)集的一切內(nèi)容均來(lái)自優(yōu)酷,對(duì)其間的安全性、多樣性和內(nèi)容質(zhì)量有著非常嚴(yán)厲的標(biāo)準(zhǔn)。據(jù)達(dá)摩院介紹,Youku-mPLUG中包含了45種不同類型的1000萬(wàn)個(gè)視頻文本,這些視頻文本從4億個(gè)原始視頻中篩選而出,首要用于大規(guī)模預(yù)練習(xí)。 達(dá)摩院表示,Youku-mPLUG可以幫助研制人員在未來(lái)進(jìn)行更深入的多模態(tài)研究,開(kāi)宣布更好的應(yīng)用。 |
|