به گزارش مردم فردا،مدلهای هوش مصنوعی تولید تصویر محبوبیت زیادی دارند و سرویس میدجرنی هم یکی از همین برنامههای پرطرفدار است. بهتازگی این سرویس یک ویژگی کاربرپسند را معرفی کرده است: توانایی بازآفرینی کاراکترهای ثابت در تصاویر مختلف.
به گزارش Venturebeat، اکثر سرویسهای تولیدکننده تصاویر، به «مدلهای انتشار» (Diffusion) متکی هستند. این ابزارها با دریافت متن از کاربر، تلاش میکنند تصویر بسازند.
بااینحال، مشکل همه برنامههای هوش مصنوعی مولد در ناهماهنگبودن پاسخها است. هوش مصنوعی برای هر درخواست، تصویر جدیدی تولید میکند؛ حتی اگر همان درخواست تکرار شود یا از برخی از کلمات کلیدی مشابه در دستور قبلی استفاده شود.
این موضوع ممکن است برای تولید محتوای کاملاً جدید عالی باشد. بااینحال اگر کاربر درحال داستانسرایی، رماننویسی یا تولید محتواهای بصری باشد، شاید بخواهد از شخصیتی یکسان در تمام عکسهای خود بهره ببرد و تنها حالات چهره، لباس و محیط پیرامون آن شخصیت را تغییر دهد.
دستیابی به این سناریوی دقیق که معمولاً برای تداوم روایت ضروری است، تاکنون با هوش مصنوعی مولد بسیار دشوار بوده است. اما میدجرنی ویژگی جدیدی را برای حل این مشکل ارائه کرده است.
ویژگی جدید میدجرنی چگونه کار میکند؟
این سرویس هوش مصنوعی یک برچسب جدید به نام «–cref» (مخفف «مرجع کاراکتر») معرفی کرده است که کاربران میتوانند آن را به انتهای پیامهای متنی خود در دیسکورد میدجرنی اضافه کنند و همان شخصیت در عکسهای تولیدی بعدی وجود داشته باشد. کاربر میتواند ویژگیهایی مثل شکل بدن و حتی لباسها را از طریق URL تغییر دهد.
با این برچسب، میدجرنی احتمالاً میتواند از یک ابزار سرگرمکننده یا ایدهپرداز، به یک سرویس حرفهایتر برای داستانگویی تبدیل شود.