OpenAI o1으로 크로스워드 풀기
Wordle과 Connections에 이어 뉴욕타임즈에서 제공하는 다른 단어 게임인 크로스워드(십자말풀이)를 풀어보려고 합니다. 크로스워드에는 두 가지 버전이 있는데, 그 중에 무료로 제공되는 미니 크로스워드(Mini Crossword)를 풀어보려고 합니다.
미니 크로스워드는 이름에서 알 수 있다시피 문제가 아주 크진 않습니다. 보통 5글자 정도의 단어들을 풀어야 합니다. 아주 어려운 게임은 아닌데, 특징이라면 문제를 어떻게든 주어진 그리드 안에 꽉 채우려다보니 가끔은 일반적인 크로스워드와는 다른 억지스러운 문제들이 섞여있다는 점이 있습니다.
예를 들면 정답이 ‘-s’가 붙도록 단어의 복수형 혹은 현재형이거나, 다른 언어가 섞여 있거나, 문제가 다른 문제를 참조하도록 되어 있는 경우 등이 있습니다. 마침 오늘의 문제에는 그 중 두 종류나 있습니다. 가로 1, 4, 5번이 하나의 답을 푸는 데 같이 사용하도록 되어 있고, 세로 1번은 프랑스어로 답을 찾아야 합니다.
o1 모델에게 문제에서 제시된 가로세로 단어들에 대한 힌트들, 그리고 전체 게임 구조에 대한 묘사를 알려줬습니다. 딱 그것만 알려주고 기다렸습니다. 의외로 크로스워드가 푸는 데 시간이 오래 걸렸습니다. Connections가 약 21초 걸린 것에 반해 크로스워드는 1분이 넘게 걸렸습니다. 저는 Connections가 겉으로 잘 드러나지 않는 단어들의 관계를 추론하기가 더 어려울 것이라고 생각했었는데, o1에게는 오히려 그 반대인 것 같습니다.
문제를 알려주면 일단 문제를 이해하는 것부터 시작합니다. 퍼즐의 구조를 다시 확인하고, 가로세로 단어의 힌트를 정리하면서 퍼즐의 구조를 바탕으로 각각 몇 글자인지 파악합니다. 특히, 가로 1, 4, 5번은 세 개를 합쳐서 하나의 답을 만든다는 것도 파악하고 있습니다.
약 69초가 걸려서 문제를 풀었습니다. 제 예상보다는 오래 걸리긴 했지만 오늘의 문제의 단어 힌트들이 일반적인 것들보다 더 꼬아놓은 것들이 있기 때문에 그런 것일 수도 있습니다. 이 부분은 제 기대 이상으로 잘 풀어서 더욱 놀라웠던 것 같습니다.
o1을 사용하면서 느끼는 것이, 소 잡을 칼로 닭을 잡는 것이 아닌가 할 때가 있었습니다. 조만간 o1-mini 모델로 비슷한 게임들을 한 번 풀어보고 o1과 o1-mini의 성능을 한 번 비교해보도록 하겠습니다.
'AI' 카테고리의 다른 글
OpenAI의 o1-preview vs. o1-mini: 게임 풀기 성능 비교 (1) | 2024.09.20 |
---|---|
AI와 인간 소통의 단절: 기술의 발전이 우리의 진정성을 훼손하고 있는가? (2) | 2024.09.20 |
AI의 발전과 탄소 배출의 관계 (1) | 2024.09.20 |
OpenAI o1의 '사용자 기만' 문제 (5) | 2024.09.20 |
OpenAI o1으로 Connections 풀기 (1) | 2024.09.19 |
GPT-4와 o1의 Wordle 풀이능력 비교 (0) | 2024.09.19 |
OpenAI o1 모델로 한국인들만 알아보는 한국어 리뷰 파훼하기 (2) | 2024.09.18 |
OpenAI o1 모델이란? (1) | 2024.09.18 |
댓글
이 글 공유하기
다른 글
-
AI의 발전과 탄소 배출의 관계
AI의 발전과 탄소 배출의 관계
2024.09.20 -
OpenAI o1의 '사용자 기만' 문제
OpenAI o1의 '사용자 기만' 문제
2024.09.20 -
OpenAI o1으로 Connections 풀기
OpenAI o1으로 Connections 풀기
2024.09.19 -
GPT-4와 o1의 Wordle 풀이능력 비교
GPT-4와 o1의 Wordle 풀이능력 비교
2024.09.19