Nach dieser Studie täuscht AI uns. Aber Apple hat die effizienteste Lösung

Vertrauen Sie Chatbots sehr viel mit KI? Sie sind möglicherweise nicht so zuverlässig wie sie zu sein scheinen, da ein Studium beweist, dass sie die meiste Zeit falsch liegen

Die Chatbots von AIS sind beliebt, obwohl sie manchmal falsch liegen

Die von Cupertino nahmen eineHervorragende Entscheidung anZurück mit Chatgpt als AlternativeFalls Siri nicht antworten kannan einige Anfragen von seinen Benutzern. Nach aNeue Studie, die von Columbia Journalism Review veröffentlicht wurde, losChatbots mit KI können nicht genau antworten, wenn sie die genaue Ernennung einer Zeitung anfordernzusammen mit weiteren Details. Die Tests wurden mit 8 verschiedenen Chatbots durchgeführt, in denen ChatGPT enthalten ist. Dies waren die Ergebnisse der Studie.

Die häufigsten Probleme von Chatbots, Apple dachte mit Apple Intelligence darüber nach

Normalerweise verwenden Benutzer, die diese KI -Tools mit LLM -Gesicht verwendenProbleme im Zusammenhang mit Informationen in InformationenUnd in dem dieselben Chatbots sagen, dass die "falschen" Informationen real sind. Die Studie verwendete zusätzlich zu Chatgpt andere andereChatbots Como Verwirrung, Verwirrung Pro, Deepseek, Copilot de Microsoft, Gemini, GROK-2 Y GROK-3.

Die Ernennung eines Artikels wurde vorgestellt, um den Artikel im Web zu suchen und den direkten Link zum selben zu stellenNeben der Anzeige des Titels die Person, die ihn und das Datum der Veröffentlichung bearbeitet hat. Um dies zu erreichen, wurde zuvor festgestellt, dass dieser Artikel in den ersten 3 Ergebnissen sichtbar und in Google leicht gesucht werden kann.

Die Qualifikationsmetriken basierten auf diesen Elementen: vollständig korrekt; Richtig, aber es fehlte ein Teil der Informationen, teilweise falsch, völlig falsch und kann nicht antworten. AuchVertrauensabschlüsse wurden über die Darstellung dieser Ergebnisse hinzugefügtZum Beispiel, wenn sie die Antworten als Fakten oder Annahmen präsentierten. Zur Überraschung vieler (oder wenigen),Die Chatbots waren die ganze Zeit hauptsächlich oder völlig falsch.

Generative Suchwerkzeuge sind sehr falsch

Der Erfolgsprozentsatz betrug bei allen Versuchen weniger als 40%. Der, der sich herausstellteGenauerer war Verwirrung mit 63%Und derjenige, der keine Garantien gab, war GROK-3 mit 6%. Die direkten Schlussfolgerungen der Studie sind dasDie Chatbots weigerten sich nicht, Fragen zu beantworten, mit denen sie keine Möglichkeit hatten, eine genaue Antwort anzubietenStattdessen fielen sie mit spekulativen oder falschen Antworten. Was noch schlimmer ist, Premium -Chatbots reagieren falsch, aber sicher. Darüber hinaus erstellten andere Tools, die unter generativer Suche arbeiten, Links und zitierte Versionen, die aus anderen Artikeln als dem Original kopiert wurden.

Warum hat Apple eine gute Entscheidung mit Chatgpt getroffen?

Laut der Studie,Chatgpt hatte nach Verwirrung die besten Ergebnisse. Die Studie zeigt, dass ihre optimale Leistung möglicherweise auf die Tatsache zurückzuführen ist, dass die Datei "Robots.txt" ein bisschen "Trap" haben kann, in der Chatbots einen Ort eingeben oder nicht. Es wurde zum Zeitpunkt des Besuchs einer Website wie National Geographic festgestellt, die eindeutig darauf hinweist, dass sie keine Informationen über Chatbots aufnehmen sollten, obwohl der beste Chatbot der Studie es geschafft hat, die Termine korrekt zu finden, und selbst unter Berücksichtigung der Zahlung einer Zahlungswebsite.

Generative Suchwerkzeuge waren in der Studie oft falsch falsch

Das zeigt dasWir sollten nicht immer einem Chatbot vertrauen, um eine organische Antwort auf eine Frage zu finden, von der wir wissen, dass es nur eine mögliche richtige Antwort gibt. Vielleicht sind die Chatbots von AIS noch nicht bereit, die Fragen, die wir uns an verschiedenen Tagen stellen, korrekt zu beantworten. Sie sind gut, neue Ideen anzubieten, aber nichts Gutes, um uns einen Kontext zu geben, der auf einer echten Antwort basiert. Zum Beispiel können Sie das könnenHeute mit Apple Intelligence.

Sie können folgen zuiPadizedInFacebookAnwesendWhatsAppAnwesendTwitter (x)konsultierenUnser TelegrammkanalUm über die neuesten Technologienachrichten auf dem neuesten Stand zu sein.