Web Analytics Made Easy - Statcounter

خبرگزاری علم وفناوری آنا؛ شرکت اُپن‌ای آی در اقدامی که بنا بر ادعای رسانه‌ها غیرقانونی است، از یک میلیون ساعت ویدیوی یوتیوب برای آموزش مدل هوش مصنوعی خود استفاده کرده است.

دو رسانه آمریکایی، وال استریت ژورنال و نیویورک تایمز، گزارش داده‌اند که شرکت‌های توسعه‌دهنده هوش مصنوعی مانند اُپن‌ای آی در یافتن داده‌های باکیفیت برای آموزش مدل‌های خود با مشکلاتی مواجه شده‌اند و در این میان اُپن‌ای آی در اقدامی غیرقانونی از محتوای یوتیوب استفاده کرده است، اما گرِگ براکمن (Greg Brockman)، رئیس اُپن‌ای آی که شخصاً در گردآوری ویدیو‌ها شرکت داشته است ادعا می‌کند که رویکردش در استفاده از ویدیو‌های یوتیوب منصفانه بوده است.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

روش‌های قدیمی پاسخگو نیستند

اُپن‌ای آی گردآوری منابع داده‌های مفید را در سال ۲۰۲۱ به پایان رساند و سپس به سراغ پیاده‌سازی ویدیوها، پادکست‌ها و کتاب‌های صوتی یوتیوب رفت. این شرکت پیشرو در حوزه تحقیقات هوش مصنوعی از مقادیر زیادی داده برای آموزش مدل‌های هوش مصنوعی خود استفاده می‌کند تا مجموعه داده‌های منحصر به فردی را برای هر مدل ایجاد کند و اخیراً در حال بررسی راه‌هایی برای تولید داده‌های مصنوعی خود بوده است. تا پیش از این، اُپن‌ای آی مدل‌های خود را بر اساس داده‌های کد رایانه‌ای گیتهاب (Github) و محتوای تکالیف مدرسه در نرم‌افزار کوییزلِت (Quizlet) آموزش می‌داد.

نیاز به تولید داده‌های جدید

لیندزی هلد (Lindsay Held)، سخنگوی شرکت اُپن‌ای آی، گفت که این شرکت مجموعه داده‌های منحصربه‌فردی را برای هر یک از مدل‌های خود تنظیم می‌کند تا رقابت تحقیقاتی خود را در سطح جهانی حفظ کند. هلد افزود که این شرکت از «منابع متعددی از جمله داده‌های در دسترس عموم و مشارکت برای داده‌های غیرعمومی» استفاده می‌کند و در تلاش است داده‌های مصنوعی خود را تولید کند.

استفاده غیرمجاز از ویدیو‌های یوتیوب

به گفته نیویورک تایمز، یکی از مدیران گوگل به نام مت برایانت گفته است که آنها گزارش‌های تأییدنشده‌ای در مورد فعالیت اُپن‌ای آی مبنی بر دانلود غیرمجاز محتوا از یوتیوب دریافت کرده‌اند. نیل موهان، مدیرعامل یوتیوب نیز اظهار داشت که اُپن‌ای آی ممکن است از یوتیوب برای آموزش مدل تولید ویدیوی سورا (Sora) استفاده کرده باشد. برایانت گفت که گوگل برای جلوگیری از این قبیل استفاده‌های غیرمجاز، زمانی که دلیل فنی واضحی برای انجام این کار داشته باشد، اقدامات قانونی را انجام می‌دهد.

محدودیت‌ها و چالش‌ها

بر اساس گزارش‌های نیویورک تایمز، شرکت متا نیز به دلیل کمبود داده‌های خوب برای آموزش فناوری هوش مصنوعی خود با چالش‌هایی مواجه شده است. مذاکرات تیم هوش مصنوعی این شرکت برای استفاده از محتوای دارای حق نشر هنوز به نتیجه نرسیده است. متا برای بهبود داده‌های خود، از پرداخت هزینه‌های حق نشر کتاب تا حتی خرید ناشر‌های بزرگ پیش رفته است. با این حال، متا همچنان به دلیل تغییرات مربوط به حریم خصوصی در نحوه استفاده از داده‌های کاربران با محدودیت‌هایی روبه‌رو است.

دنیای آموزش مدل‌های هوش مصنوعی با کمبود داده‌های آموزشیِ با کیفیت دست‌و‌پنجه نرم می‌کند. وال استریت ژورنال این هفته نوشت که شرکت‌های توسعه دهنده مدل‌های هوش مصنوعی ممکن است تا سال ۲۰۲۸ از محتوای موجود پیشی بگیرند و با کمبود جدی روبه‌رو شوند.

این گزارش ازپایگاه اینترنتی دِ ورج به فارسی برگردان شده است.

انتهای پیام/

نازنین احسانی طباطبایی

منبع: آنا

کلیدواژه: هوش مصنوعی داده یوتیوب گوگل متا برای آموزش مدل مصنوعی خود هوش مصنوعی ا پن ای آی

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت ana.press دریافت کرده‌است، لذا منبع این خبر، وبسایت «آنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۴۰۰۸۲۴۶۵ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

شرکت هوش مصنوعی ایلان ماسک سرمایه ۶ میلیارد دلاری جذب می‌کند؟

یکی از شرکت‌های بزرگ سرمایه‌گذاری خطرپذیر در سیلیکون ولی در حال بررسی سرمایه‌گذاری ۶ میلیارد دلاری روی استارتاپ هوش مصنوعی xAI ایلان ماسک و چت‌بات گراک است.

به‌گزارش The Information، ایلان ماسک در حال نزدیک‌شدن به معامله‌ی اولیه با سرمایه‌گذاران بالقوه ازجمله Sequoia Capital است که در سال ۲۰۲۲ در ایکس (توییتر سابق) ۸۰۰ میلیون دلار سرمایه‌گذاری کرده بود.

منابع داخلی مشخص نکردند که Sequoia قصد دارد چه مقدار سرمایه اختصاص دهد یا چه شرکت‌های دیگری ممکن است در جمع‌آوری سرمایه شرکت کنند؛ اما فایننشال تایمز و بلومبرگ تأیید کردند که Sequoia قصد دارد در این معامله شرکت کند. ماسک پیشنهاد کرده است که شرکت‌ها قبل از شروع سرمایه‌گذاری رقبا وارد دور اول جذب سرمایه شوند.

بلومبرگ خاطرنشان کرد که این سرمایه ارزش شرکت را به ۱۸ میلیارد دلار می‌رساند که فاصله‌ی چندانی با ارزش‌گذاری آنتروپیک ندارد. آنتروپیک، یکی دیگر از رقبای OpenAI است که اعضای سابق این شرکت آن را تأسیس کرده‌اند و در اوایل سال ۲۰۲۴، سومین مرحله‌ی جذب سرمایه را با ارزشی حدود ۱۸٫۴ میلیارد دلار افزایش داد.

با اینکه استارتاپ هوش مصنوعی ماسک هنوز در مراحل اولیه‌ی توسعه است، به‌نظر می‌رسد صندوق‌های سرمایه‌گذاری خطرپذیر از چشم‌انداز بازدهی کلان این شرکت حمایت می‌کنند و مانند بسیاری از شرکت‌ها بر موج عظیم هوش مصنوعی سوار می‌شوند.

استارتاپ هوش مصنوعی xAI اوایل مارس ۲۰۲۴ (اسفند ۱۴۰۳) چت‌بات گراک را به مدل زبانی Grok-۱.۵ به‌روزرسانی کرد. این چت‌بات که نسخه‌ی پیشرفته‌تر گراک است، به‌عنوان رقیبی برای ChatGPT شرکت OpenAI معرفی شد و در‌اختیار کاربران نسخه‌ی پریمیوم شبکه‌ی اجتماعی ایکس قرار گرفت.

منبع: زومیت

باشگاه خبرنگاران جوان علمی پزشکی فناوری

دیگر خبرها

  • توسعه زیرساخت های آموزشی در استان سمنان/ افتتاح ۱۴ چمن مصنوعی
  • اپل با هوش مصنوعی به میدان می‌آید
  • تولید اقلام استراتژیک امدادی مورد نیاز در حوادث توسط هلال احمر
  • حذف اپ‌های هوش مصنوعی از اپ‌استور به دلیل محتوای نامناسب
  • حذف هوش مصنوعی غیراخلاقی از اپ استور
  • آینده رقابت متا با غول‌های هوش مصنوعی
  • شرکت هوش مصنوعی ایلان ماسک سرمایه ۶ میلیارد دلاری جذب می‌کند؟
  • ۱۳۵ چاه غیرمجاز در کرمانشاه مسدود شد
  • ارزش بازار آلفابت از ۲ تریلیون دلار گذشت
  • اپل دوباره با اوپن‌ای‌آی سر میز مذاکره نشست