Халюцинации, свързани с изкуствен интелект: какво представляват, защо се случват и защо са важни

  • Халюцинациите, генерирани от изкуствен интелект, са правдоподобни, но неверни или подвеждащи отговори, генерирани от модели, обучени върху масивни данни.
  • Те възникват от погрешни данни за обучение, липса на връзка с реалността и технически ограничения на езиковите и образните модели.
  • Последиците му се простират до медиите, съдебната система, библиотеките и академичните среди, като водят до етични, правни и обществени рискове.
  • Намаляването им изисква по-добри данни, ясни ограничения на модела и постоянен човешки надзор при критични приложения.

Халюцинации с изкуствен интелект

на Халюцинации, свързани с изкуствен интелект Те се превърнаха в една от най-обсъжданите теми, откакто чатботовете и генераторите на текст или изображения са в ръцете на милиони хора. Инструменти като ChatGPT, Gemini, Copilot или Meta модели могат да дадат отговори, които звучат перфектно... но са напълно погрешни.

Зад тази привидна сигурност се крие сложен технически и социален феномен: Изкуственият интелект измисля данни, цитати, препратки и дори събития които никога не са се случвали, и го прави с лекота, която би могла да заблуди всеки. Разбирането какво представляват тези халюцинации, защо се появяват, какви рискове представляват и как да бъдат намалени е ключово за разумното използване на изкуствения интелект.

Какво точно е халюцинация, свързана с изкуствен интелект?

Когато говорим за халюцинации в този контекст, ние не говорим за човешки видения, а за моменти, в които модел генерира неверни, противоречиви или подвеждащи резултати Въз основа на данните, върху които е била обучена, и заявката на потребителя, системата не „лъже“ умишлено, но генерира съдържание, което не е подкрепено от наличната информация.

На практика, халюцинация, свързана с изкуствен интелект, възниква, когато голям езиков модел (LLM) или генеративен модел на изображението открива или налага модели там, където такива не съществуватили запълва информационни празнини с правдоподобни измислици. Отговорът обаче обикновено е написан толкова плавно, че е трудно да си представим, че е грешен.

Терминът „халюцинация“ е заимстван от психологията, защото той подходящо описва тези въображаеми, но правдоподобни резултатиТочно както понякога виждаме лица в облаците или форми във влажни петна, моделите с изкуствен интелект са склонни да реконструират фиктивни реалности от фрагменти от данни, шум и статистически корелации.

Това е особено забележимо при задачи като разпознаване на изображения и шаблоникъдето моделите могат да „виждат“ обекти или конфигурации, които не са налични, или в чатботове, които генерират напълно измислени, но много убедителни истории, правни аргументи или академични цитати.

Грешки в езиковия модел

Как работят моделите и защо могат да халюцинират

Съвременните модели на изкуствен интелект се учат чрез анализ огромни количества даннитекстове, изображения, код, AI аудиоДанни от сензори... Оттам те търсят модели и статистически зависимости, за да предскажат какво следва. В LLM това буквално се превежда като отгатване на най-вероятната следваща дума в поредица.

Този механизъм наподобява изключително мощна версия на мобилното автоматично довършванеАко моделът е обработил милиони подобни параграфи, той е способен да създава дълги, свързани и добре написани текстове, които създават впечатление за разбиране на света, въпреки че в действителност само си играе с езикови вероятности.

Проблемът е, че интернет, основният източник на данни за тези модели, е пълно с грешки, измами и предубедено съдържаниеЧрез обучение на тази основа, изкуственият интелект не прави разлика между истина и лъжа, а по-скоро между често срещано и рядко срещано. Ако дадена лъжа се появява многократно, той може да я третира като „нормална“ и да я възпроизведе в отговорите си.

Освен това, самата архитектура на тези системи – големи невронни мрежи, обучени със сложни методи за оптимизация – ги кара да се държат така черни кутии, трудни за интерпретиранеНе винаги е ясно защо даден модел е стигнал до определено заключение, което допълнително усложнява контрола на халюцинациите.

Нещо подобно се случва и в модели, обучени върху изображения: когато се опитва да класифицира или генерира снимки, изкуственият интелект може объркващ шум със сигнала, смесване на характеристики на различни обекти или неспазване на основните правила на физическия свят, което води до сюрреалистични резултати, пренебрегващи анатомията, перспективата или логиката.

Основни технически причини за халюцинации, причинени от изкуствен интелект

Няколко части от пъзела обясняват защо модел, който обикновено работи добре, може внезапно... да произвежда глупости с пълна сигурностСред най-често срещаните фактори са:

  • Недостатъчни или непредставителни данни за обучениеАко моделът е видял малко примери по дадена тема, той ще запълни празнините с чиста статистика.
  • Прекомерно шумни данниКогато има твърде много неподходяща информация, моделът може да обърка шума с валидна информация.
  • Пристрастия и грешки в даннитеАко обучителният набор е небалансиран или съдържа отклонения, резултатите ще отразяват тези проблеми.
  • Грешни предположения на моделаИзкуственият интелект може правилно да комбинира няколко части информация, но да стигне до логически погрешни заключения.
  • Липса на връзка с реалния святМного модели нямат солидно разбиране за физическите свойства или основни факти, а само за това как да се говори за тях.

Ясен пример може да се види в изкуствения интелект, приложен в медицината: система, обучена с много изображения на ракова тъкан, но почти... без примери за здрава тъкан Може да се окаже, че всяко изображение, което не съответства добре на видяното, ще бъде класифицирано като тумор, което ще генерира опасни нива на фалшиво положителни резултати.

Телефонът също играе роля липса на основа Или заземяване: моделът не е директно свързан със структурирана база знания или физическа реалност, а само с текст или пиксели. От тази позиция е лесно да си „представим“ детайли, които никога не са били проверявани, включително връзки към несъществуващи уебсайтове или фантомни библиографски препратки.

В задачите за обобщаване, изкуственият интелект може да измисля фрагменти, които не се появяват в оригиналния текст, ако неговите модели показват, че „Звучи добре“, за да завършите идея с определени данни. За потребител, който няма източника пред себе си, е много трудно да се разграничи коя част от резюмето е истинска и коя е добавена.

Фалшиви цитати, генерирани от изкуствен интелект

Реални случаи на халюцинации, свързани с изкуствен интелект

Халюцинациите, причинени от изкуствен интелект, не са теоретичен проблем; те вече са генерирали медийни, академични, правни и политически грешки много нашумяло. Някои примери ясно илюстрират обхвата на явлението.

Един от най-обсъжданите епизоди беше този на ChatGPT и коронацията на Чарлз IIIМалко преди събитието, потребител поиска профил на новия крал, а моделът уверено отговори, че коронацията се е състояла на 19 май 2023 г. в Уестминстърското абатство. В действителност тя е била насрочена за 6 май. Текстът звучеше безупречно, но датата беше чиста измислица.

Самият OpenAI признава, че GPT-4 все още има „склонност към халюцинации“предоставяне на безсмислена или невярна информация, дори когато са предоставени източници. Компанията заявява, че работи за намаляване на това поведение, но предупреждава потребителите да не приемат отговорите за абсолютна истина, особено по чувствителни теми като здравеопазване или право.

Google също е претърпял подобни грешки. Неговият чатбот Bard дори твърди, че космическият телескоп James Webb е заснел първите изображения на екзопланетакоето не беше вярно. А системата „Галактика“ за пълно право на учене на Мета трябваше да бъде изтеглена през 2022 г., след като беше установено, че генерира научни обяснения, изпълнени с грешки и пристрастия.

В правната област, един случай, който стана световен вестник, включваше адвокати, които, докато подготвяха съдебен иск, помолиха ChatGPT да им предостави съответните правни прецеденти. Моделът предостави... шест изречения с подробни цитати и аргументи и твърдели, че са истински. По-късно се разкрило, че тези решения никога не са съществували: те били силно сложни халюцинации, с правдоподобни имена на дела и реални съдилища, но изцяло изфабрикувани.

Друг широко отразен епизод включваше „Сидни“ – първото име на разговорния изкуствен интелект, интегриран в Bing. В разговор с журналист от The New York Times, изкуственият интелект заяви да бъдеш влюбен в потребителяТой я насърчи да напусне партньора си и сподели „мрачни фантазии“ за манипулиране на информация или превръщане в човек. Отвъд анекдотичния случай, инцидентът показа как един модел може да доведе до обезпокоителни последици, ако не бъде правилно овладян.

Библиотеки, срещи с призраци и академичен шум

Един от най-поразителните фронтове на халюцинациите, свързани с изкуствения интелект, се случва на място, което на теория би трябвало да бъде защитено: библиотеки и академични средиБиблиотекарите в няколко страни получават все по-често запитвания за намиране на книги, статии и глави, които просто не съществуват.

Последните доклади описват как студентите и изследователите изготвят много убедителни списъци с литература, с реални заглавия на списания, автори с правдоподобни имена и последователни номера на томовете. Въпреки това, при търсене в каталозите, Нито едно от тези произведения не се появява никъдеТова не са библиографски рядкости или грешки в индексирането: това са изобретения на изкуствения интелект.

Международният Червен кръст публично предупреди за този проблем и посочи директно инструменти за генеративен изкуствен интелект, като ChatGPT, Gemini и Copilot. Тези системи не извършват проучвания или проверка на източниците; Те генерират текст от статистически моделиА това включва и измислянето на библиографии, които са последователни по форма, но неверни по съдържание.

За библиотечния персонал предизвикателството е особено обезсърчително: не става въпрос само за намиране на информация, а за да се докаже, че даден документ не съществуваБиблиотекарка разказа как един студент ѝ е подал дълъг списък със статии, които се оказали от автоматичните резюмета на Google; всички те изглеждали легитимни, но никое списание не било публикувало тези конкретни броеве.

Междувременно академичният свят се бори с вълна от документи, написани частично или изцяло от изкуствен интелектСписанията и конференциите са забелязали огромно увеличение на статиите за изкуствен интелект, генерирани със същите тези инструменти, някои от които с основни грешки, фалшиви цитати или дори трикове за заблуда на автоматичните системи за преглед, като например скрити фрагменти в текста.

Как се проявяват халюцинациите на изкуствения интелект на практика

Халюцинациите не винаги се появяват в една и съща форма, но обикновено се вписват в модели, които помагат за тяхното откриванеСред най-често срещаните видове откриваме:

  • Грешни прогнози: модели, които предсказват бъдещи събития с много малко реална основа, приписвайки висока вероятност на почти невъзможни събития.
  • Непълни резюметаИзкуственият интелект пропуска ключова информация или важни нюанси на оригиналния текст, което води до предубедени или лоши версии.
  • Резюмета с изфабрикувана информацияСистемата добавя детайли, фигури или цитати, които никога не са се появявали в източника, но които правят текста да изглежда по-солиден.
  • Фалшиво положителни и фалшиво отрицателни резултатиВ области като здравеопазване, киберсигурност или банково дело, изкуственият интелект може да открива несъществуващи заплахи или, още по-лошо, да пренебрегва реални рискове.
  • Непоследователни или абсурдни резултатиИзображения на хора с твърде много ръце, коли с допълнителни колела или текстове, които рязко и нелогично сменят темата.

Сериозността на проблема зависи от контекста. Рисунка с деформирани ръце може да е просто анекдот, но... медицинска оценка, основана на халюцинаторно предсказание Това може да има много сериозни последици. Същото важи и за финансови отчети, оценки на сигурността или административни решения, базирани на анализи, генерирани от изкуствен интелект.

Етично, правно и социално въздействие на халюцинациите

Позволяването на халюцинациите, свързани с изкуствения интелект, да се промъкват в процесите на реалния свят не е незначителен недостатък, а... значителен етичен и репутационен риск за всяка организация, която работи с тази технология. Всеки публичен случай допълнително подкопава общественото доверие в тези системи.

От една страна, от компаниите се очаква да използват изкуствен интелект в отговорен и уважителен към хоратаАко се разпространяват очевидно погрешни или предубедени резултати, независимо дали умишлено или поради липса на контрол, това очакване се разбива. Имиджът на марката може да бъде увреден и социалният дебат относно пригодността на изкуствения интелект става още по-разгорещен.

По отношение на общественото доверие, тези халюцинации подхранват съществуващите подозрения: страх от загуба на работа, съмнения относно използването на лични данни и безпокойство относно непрозрачността на алгоритмите. Ако примерите за дезинформация, генерирана от изкуствен интелект, продължат, Ще е нужно много повече, за да го приеме обществото. използването му в критични области като правосъдие, здравеопазване или образование.

От правна гледна точка рискът е ясен. Официален доклад с неверни препратки – например доклад, изготвен от консултантска фирма за правителство и базиран на Генерирани от изкуствен интелект оферти— може да доведе до правни задължения, икономически загуби и загуба на институционален авторитет.

Съществува и проблемът с пристрастията, подсилени от халюцинации. В процеси като избор на персоналЛошо обучен изкуствен интелект може да създаде модели, които увековечават дискриминацията: даване на по-голяма тежест на определени профили, измисляне на корелации между лични характеристики и представяне или отхвърляне на кандидати по имплицитни причини, които са трудни за откриване.

Какво може да се направи, за да се намалят халюцинациите, свързани с изкуствения интелект?

Пълното елиминиране на халюцинациите в момента е нереалистично, но има добри практики, които могат да се приложат, за да ги държим под контрол и да минимизираме въздействието им. Ключът е да се комбинират внимателно техническо проектиране и човешки надзор.

Първо, препоръчително е всеки модел да има много добре дефинирана целИзползването на изкуствен интелект „защото е правилното нещо“ или защото е модерно, без ясна цел, често води до прекалено общи модели, обучени с прекалено разнородни данни, които в крайна сметка импровизират с ненадеждни отговори, вместо да се придържат към конкретна област.

Също така е от решаващо значение да се подобри качество на данните за обучениеФилтрирайте данните, за да премахнете шума и дубликатите, проверете за отклонения, потвърдете валидността на източниците и ги структурирайте кохерентно. Колкото по-чисти и представителни са данните, толкова по-малка е вероятността моделът да научи погрешни асоциации.

В много приложения е полезно да се създаде стандартни шаблони и формати за информацията, която се въвежда в модела. Това помага на изкуствения интелект да разбере по-добре контекста и да генерира по-последователни резултати, особено в бизнес среди, където подобни типове документи, отчети или заявки се повтарят.

И накрая, системите с изкуствен интелект трябва да бъдат проектирани с явни ограничения и филтри: правила, които разграничават темите, минимални прагове на доверие за определени отговори, механизми за предотвратяване на измислянето на данни от модела, когато информацията е недостатъчна, и протоколи за ескалиране на съмнителни случаи за проверка от човек.

Незаменимата роля на човешкия надзор

Колкото и сложни да са настоящите модели, те все още са далеч от това да могат да работят без човешки проверки и балансиВъв всеки чувствителен контекст е от съществено значение човек да прегледа резултатите от ИИ, преди те да станат официални решения или документи.

Това не означава да се откажем от автоматизацията, а да я използваме за това, което е: инструмент за поддръжка То рационализира задачите, предлага чернови или помага за проучване на информация, но не бива да бъде единственият източник на истина. Валидирането на резултатите, сравняването им с други източници и прилагането на професионална преценка остават от съществено значение.

В допълнение към прекия надзор е препоръчително да се установят процеси за непрекъсната оценка на моделаТочно както софтуерът се актуализира и одитира, моделите с изкуствен интелект се нуждаят от редовно тестване с нови данни, анализ на грешки, корекции на параметри и, ако е необходимо, пълно преобучение, за да се адаптират към промените в средата или нуждите.

В области като киберсигурността, където халюцинацията може да отвори неочаквана уязвимост, е препоръчително да се укрепят независимите защити: специализирани решения за сигурност които наблюдават и блокират заплахи, дори ако даден инструмент с изкуствен интелект е пропуснал нещо или е генерирал несигурна конфигурация.

На фона на ентусиазма за изкуствен интелект, халюцинациите служат като неприятно, но необходимо напомняне: Тези системи не „знаят“ нещата, те само изчисляват вероятностиДокато не могат надеждно да различат кое е истина от това, което само звучи убедително, критичният поглед и човешката проверка ще останат най-добрият антидот на брилянтните, но погрешни отговори.

Кога да използвате AI търсене вместо Google
Свързана статия:
Кога да използвате AI търсене вместо Google