Ein neuer Mathematiktest zeigt eine Grenze moderner KI, die in normalen Benchmarks oft verborgen bleibt. Beim Projekt First Proof mussten Sprachmodelle an bisher unveröffentlichten Problemen aus der Forschungsmathematik...weiterlesen »