OpenAI o1으로 Connections 풀기
뉴욕타임즈에서 제공하는 단어 게임 중에 ‘Connections’라는 것이 있습니다. 이는 16개의 단어가 주어지면 이들을 네 개의 관련 있는 그룹으로 적절히 나누는 퍼즐입니다.
개인적으로는 뉴욕타임즈의 게임들 가운데 가장 어려운 것 중 하나라고 생각합니다. 그 이유는 이게 꼭 의미론적으로 관련 있는 단어들을 모으는 것만이 풀이가 되는 것이 아니라, 완전 색다른 방식으로 단어들 사이의 관계를 찾아야 하기 때문입니다. 주어지는 예시만 보더라도 ‘bass’, ‘flounder’, ‘salmon’ 그리고 ‘trout’는 물고기의 종류로 그룹을 만들 수 있어서 비교적 명확한 편이지만, 꼭 그렇지 않은 경우도 있습니다. 가령, ‘ant’, ‘drill’, ‘island’ 그리고 ‘opal’은 모두 ‘fire’ 뒤에 올 수 있다는 공통점으로 하나의 그룹으로 묶이는데, 이런 경우는 비교적 어려운 그룹에 속합니다. 16개의 단어들은 비교적 직관적인 그룹부터 상당히 헷갈리는 그룹까지 섞여있고, 게임 참가자는 이들의 단어를 4개의 그룹으로 나눠야 합니다.
어떻게든 푸는 워들과는 달리 Connections는 비교적 빨리 포기하는 편이었습니다. 가장 쉬운 그룹도 보이지 않는 경우가 가끔 있어서 그랬습니다. 그리고 어떨 때는 문화적 차이 때문에 답을 찾기 어려운 경우도 있었습니다. 그럴 때는 정답을 보고 나면, 빠르게 포기하길 잘했다는 생각도 들 때가 있었습니다.
아무튼 OpenAI o1의 놀라운 성능을 보고, 그리고 워들을 논리적으로 잘 풀어내는 것을 보고, 혹시 Connections도 잘 풀지 않을까 하는 생각이 들어서 시도해보려고 합니다.
오늘의 단어들은 ‘champagne’, ‘super’, ‘nova’, ‘reunion’, ‘birthday’, ‘nature’, ‘nice’, ‘cocktail’, ‘angers’, ‘extra’, ‘surprise’, ‘masterpiece’, ‘hyper’, ‘frontline’, ‘over’, ‘dinner’입니다. 일단 정답을 알고 나서 보는 입장에서 말하자면, 의도적으로 헷갈리게 하기 위한 영어가 아닌 단어들도 포함되어 있어서 플레이어를 교란시키려고 하고 있습니다.
ChatGPT를 켜고 Connections에 대해 설명을 한 후 오늘의 단어 16개를 입력했습니다. 그런데 아뿔싸! GPT-4o로 되어있는 것을 바꾸지 않고 돌렸습니다. 일단 GPT가 준 결과를 보니 아주 나쁜 시도는 아니었지만 정답이 아니라는 느낌은 바로 들었습니다. ‘파티와 관련된 단어’ 그룹은 사람이 한 번 쯤 시도할 것 같은 느낌이 들기도 했습니다.
모델을 o1-preview로 바꾸고 다시 단어들을 줬습니다. o1은 겨우 21초 정도 생각을 거친 후 바로 답을 주고 그에 대한 설명을 같이 줬습니다. 아직 답을 입력하기 전에도 뭔가 정답이라는 느낌이 바로 들었습니다. 참고로 이번 풀이에서 ‘PBS의 TV 프로그램 제목’과 같은 그룹이 미국에 살지 않았던 이용자에게는 풀기 너무 어려운 그룹입니다. '프랑스의 지명' 그룹도 프랑스 지리에 대한 이해가 많지 않으면 맞추기 너무 어려워 보입니다.
o1이 준 답들을 입력하니 한 번에 모든 그룹을 풀었습니다. 워들을 풀 때는 여러 단계에 걸쳐서 추론을 했는데 Connections는 한 번에, 그것도 21초만에 푸는 것에 상당히 놀랐습니다. 이게 이번 문제의 난이도가 쉬웠던 것인지, 아니면 워들과의 문제 특성의 차이인 것인지는 아직 잘 모르겠습니다.
아무튼 o1이 Connections를 이렇게 빠르게 푸는 것을 보고 너무 허무했습니다. 가끔 어려운 그룹을 빠르게 찾을 때의 짜릿함도 있으면서 안 풀릴 때 시간을 많이 잡아먹어서 그 스트레스가 상당히 컸습니다. 다음부터는 한 그룹이라도 빠르게 찾지 못하면 o1에게 풀게 해서 마음의 평화를 찾는 것도 하나의 방법이 될 것 같습니다.
'AI' 카테고리의 다른 글
AI와 인간 소통의 단절: 기술의 발전이 우리의 진정성을 훼손하고 있는가? (2) | 2024.09.20 |
---|---|
AI의 발전과 탄소 배출의 관계 (1) | 2024.09.20 |
OpenAI o1의 '사용자 기만' 문제 (5) | 2024.09.20 |
OpenAI o1으로 크로스워드 풀기 (0) | 2024.09.20 |
GPT-4와 o1의 Wordle 풀이능력 비교 (0) | 2024.09.19 |
OpenAI o1 모델로 한국인들만 알아보는 한국어 리뷰 파훼하기 (2) | 2024.09.18 |
OpenAI o1 모델이란? (1) | 2024.09.18 |
Transformer 모델의 이해 (1) | 2024.09.18 |
댓글
이 글 공유하기
다른 글
-
OpenAI o1의 '사용자 기만' 문제
OpenAI o1의 '사용자 기만' 문제
2024.09.20 -
OpenAI o1으로 크로스워드 풀기
OpenAI o1으로 크로스워드 풀기
2024.09.20 -
GPT-4와 o1의 Wordle 풀이능력 비교
GPT-4와 o1의 Wordle 풀이능력 비교
2024.09.19 -
OpenAI o1 모델로 한국인들만 알아보는 한국어 리뷰 파훼하기
OpenAI o1 모델로 한국인들만 알아보는 한국어 리뷰 파훼하기
2024.09.18