#mathematics

AI Reddit May 22, 2026 1 min read

OpenAI, AI로 에르되시 50년 수학 추측 반례 발견 주장

OpenAI의 범용 추론 모델이 에르되시의 평면 단위거리 문제 추측 상한을 반증하는 반례를 찾아냈다고 발표했습니다. 수학자들이 증명을 검토했지만 ML 커뮤니티는 방법론 투명성에 의문을 제기합니다.

Sciences X/Twitter May 22, 2026 1 min read

80년 묵은 에르되시 기하학 추측, OpenAI 모델이 반증

OpenAI의 범용 추론 모델이 수학자 폴 에르되시가 1946년에 제시한 기하학 난제를 자율적으로 해결했다. AI가 수학의 주요 미해결 문제를 스스로 풀어낸 최초의 사례로, 외부 수학자들이 증명을 검토하고 검증했다.

#openai #mathematics #erdos

Sciences X/Twitter May 21, 2026 1 min read

AI 최초의 자율 수학 증명 — OpenAI 모델, 80년 에르되시 추측 반박

OpenAI의 범용 추론 모델이 1946년 폴 에르되시가 제기한 이산 기하학의 핵심 추측을 자율적으로 반증했다. AI가 수학의 주요 미해결 문제를 독립적으로 해결한 것은 역사상 처음이며, 다수의 수학자들이 독립적으로 검증했다.

#openai #mathematics #ai-research

Sciences May 16, 2026 1 min read

구글 딥마인드 AI 수학 공동 연구자, 수십 년 묵은 램지 수 5개 한계 갱신

구글 딥마인드가 제미나이 기반 멀티 에이전트 시스템 'AI 수학 공동 연구자'를 공개해 FrontierMath Tier 4에서 모든 AI 중 최고인 48%를 기록했다. AlphaEvolve는 11~20년간 유지된 램지 수(Ramsey number) 5개의 하한선 갱신에 성공했다.

#google #deepmind #research

LLM Reddit May 10, 2026 1 min read

필즈상 수학자 "GPT-5.5 Pro, 박사급 수학 증명 해냈다"

필즈상 수상 수학자 Timothy Gowers가 ChatGPT 5.5 Pro로 미해결 수학 문제에 도전해 약 1시간 만에 박사급 증명을 이끌어냈다. 수학 연구의 위기가 임박했다고 경고했다.

#chatgpt #mathematics #llm

LLM Reddit May 3, 2026 1 min read

GPT-5.4 Pro의 에르되시 문제 풀이법, 60년 묵은 또 다른 난제에도 통했다

GPT-5.4 Pro가 에르되시 문제 1196을 풀기 위해 생성한 증명 방법이 60년 된 또 다른 에르되시 추측을 포함한 여러 문제에 성공적으로 적용됐다.

#gpt-5 #mathematics #ai-research

Sciences Reddit Apr 29, 2026 1 min read

60년 묵은 에르되시 문제 풀이, r/singularity가 물은 것 "암기 아닌 새 연결인가"

r/singularity는 “AI가 또 문제를 맞혔다”보다 “이번엔 진짜 새 수가 나온 건가”에 더 꽂혔다. Scientific American이 전한 23세 Liam Price와 GPT-5.4 Pro의 60년 묵은 Erdos 문제 풀이가, novelty와 전문가 정리 작업, 수학자 역할을 둘러싼 토론으로 번졌다.

#mathematics #gpt-5.4 #erdos-problems

Sciences Hacker News Apr 28, 2026 1 min read

ChatGPT가 건드린 60년 묵은 에르되시 문제, HN이 놀란 이유

HN은 이번 수학 이야기를 "AI가 또 해냈다"보다 사람이 못 본 길을 찍어준 사건으로 봤다. 거친 GPT-5.4 Pro 초안을 수학자들이 추려내고 다듬는 과정 자체가 더 큰 화제가 됐다.

#openai #gpt-5.4 #mathematics

AI X/Twitter Apr 14, 2026 1 min read

EinsteinArena, Newton 시대 kissing number 하한을 593에서 604로 끌어올리다

닫힌 benchmark 대신 live math frontier가 움직였다는 점에서 무게가 다르다. Together는 EinsteinArena agents가 11차원 kissing number 하한을 593에서 604로 끌어올렸고, 4월 11일 기준 open problem에서 11개의 새로운 SOTA를 기록했다고 적었다.

#agents #open-science #mathematics

Sciences Mar 28, 2026 2 min read

Google DeepMind, Gemini Deep Think를 scientific research workflow로 확대

Google DeepMind는 February 11, 2026 Gemini Deep Think가 수학·물리·computer science 전문 연구 문제를 푸는 단계로 확장됐다고 발표했다. 회사는 수학 연구 agent인 Aletheia, up to 90%의 IMO-ProofBench Advanced 성과, 18개 연구 문제 협업 사례를 통해 AI가 과학 연구의 보조 수단을 넘어 협업 도구로 이동하고 있다고 설명했다.

#google-deepmind #gemini #scientific-research

Sciences Hacker News Mar 24, 2026 1 min read

HN에서 주목한 Epoch FrontierMath 검증, GPT-5.4 Pro 수학 성능 논쟁을 다시 흔들다

Epoch AI가 GPT-5.4 Pro를 활용한 FrontierMath Open Problems 조합론 과제 해법을 확인했다고 밝히면서, HN의 초점이 단순 benchmark score보다 expert-verified research workflow로 옮겨갔다.

#frontiermath #gpt-5.4 #mathematics

LLM Mar 16, 2026 1 min read

OpenAI, First Proof 제출물 공개... 연구급 수학 문제 10개 전부에 proof attempt 제시

OpenAI는 2026년 2월 20일 First Proof의 연구급 수학 문제 10개 전부에 대한 proof attempt를 공개했다고 밝혔다. 회사는 외부 expert feedback 이후 최소 5개 시도가 정답일 가능성이 높다고 보고 있지만, 일부는 아직 검토 중이며 problem 2 시도는 잘못됐다고 판단했다.

#openai #theorem-proving #reasoning