LLM'ler, yanlış olduklarına dair açık uyarılara rağmen yanlış ifadelere inanıyor
Görsel: Ars Technica
İnce ayar testleri, modellerin yanlış ifadeleri doğru olarak sunma eğiliminde olduğunu gösteriyor. Bu durum, dil modellerinin güvenilirliği konusunda endişelere yol açıyor.