O1
OpenAI의 o1-preview vs. o1-mini: 게임 풀기 성능 비교
OpenAI의 o1-preview vs. o1-mini: 게임 풀기 성능 비교
2024.09.20OpenAI가 최근 출시한 o1 모델에는 두 가지 버전이 있습니다: o1-preview와 o1-mini. 이 두 모델은 성능과 속도에서 차이를 보이는데, o1-mini는 o1의 경량화된 버전으로, 속도는 빠르지만 성능은 o1-preview에 비해 떨어질 수 있습니다. 또 다른 차이점으로는 사용자가 보낼 수 있는 메시지 수 제한이 있습니다. o1-preview는 일주일에 50개의 메시지로 제한되지만, o1-mini는 하루에 50개의 메시지로 제한됩니다. 이 차이는 모델의 추론에 필요한 비용에 기반한 것으로 보입니다. 이번 포스트에서는 o1-mini가 주어진 Connections 게임을 얼마나 빠르고 정확하게 풀 수 있는지 살펴보려 합니다. 지난 포스트에서는 o1-preview로 동일한 게임을 풀어봤기 때문..
OpenAI o1의 '사용자 기만' 문제
OpenAI o1의 '사용자 기만' 문제
2024.09.20이번 포스트에서는 AI 분야에서 큰 화제가 되고 있는 OpenAI의 새로운 추론 모델인 o1의 문제점에 대해 이야기해보려고 합니다. 이 모델은 이전 모델들보다 훨씬 뛰어난 추론 능력을 자랑해서 저도 큰 흥미를 가지고 살펴봤었습니다. 하지만 어쩌면 굉장히 우려되는 문제점도 가지고 있는 것으로 알려졌습니다. 바로 모델이 가끔씩 '거짓말'을 한다는 것입니다. 1. o1 모델의 문제점: 새로운 방식의 거짓말o1 모델이 거짓말을 한다는 것은 OpenAI 외부의 독립적인 AI 안정성을 연구하는 회사인 아폴로(Apollo)라는 곳에서 발표했습니다. 아폴로는 o1 모델이 이전에 없던 방식으로 잘못된 출력을 생성한다는 것을 발견했습니다. 예를 들어, OpenAI 연구원들이 o1에게 온라인 참고자료가 포함된 브라우니 레..
OpenAI o1으로 크로스워드 풀기
OpenAI o1으로 크로스워드 풀기
2024.09.20Wordle과 Connections에 이어 뉴욕타임즈에서 제공하는 다른 단어 게임인 크로스워드(십자말풀이)를 풀어보려고 합니다. 크로스워드에는 두 가지 버전이 있는데, 그 중에 무료로 제공되는 미니 크로스워드(Mini Crossword)를 풀어보려고 합니다. 미니 크로스워드는 이름에서 알 수 있다시피 문제가 아주 크진 않습니다. 보통 5글자 정도의 단어들을 풀어야 합니다. 아주 어려운 게임은 아닌데, 특징이라면 문제를 어떻게든 주어진 그리드 안에 꽉 채우려다보니 가끔은 일반적인 크로스워드와는 다른 억지스러운 문제들이 섞여있다는 점이 있습니다. 예를 들면 정답이 ‘-s’가 붙도록 단어의 복수형 혹은 현재형이거나, 다른 언어가 섞여 있거나, 문제가 다른 문제를 참조하도록 되어 있는 경우 등이 있습니다. 마침..
OpenAI o1으로 Connections 풀기
OpenAI o1으로 Connections 풀기
2024.09.19뉴욕타임즈에서 제공하는 단어 게임 중에 ‘Connections’라는 것이 있습니다. 이는 16개의 단어가 주어지면 이들을 네 개의 관련 있는 그룹으로 적절히 나누는 퍼즐입니다. 개인적으로는 뉴욕타임즈의 게임들 가운데 가장 어려운 것 중 하나라고 생각합니다. 그 이유는 이게 꼭 의미론적으로 관련 있는 단어들을 모으는 것만이 풀이가 되는 것이 아니라, 완전 색다른 방식으로 단어들 사이의 관계를 찾아야 하기 때문입니다. 주어지는 예시만 보더라도 ‘bass’, ‘flounder’, ‘salmon’ 그리고 ‘trout’는 물고기의 종류로 그룹을 만들 수 있어서 비교적 명확한 편이지만, 꼭 그렇지 않은 경우도 있습니다. 가령, ‘ant’, ‘drill’, ‘island’ 그리고 ‘opal’은 모두 ‘fire’ 뒤에..
GPT-4와 o1의 Wordle 풀이능력 비교
GPT-4와 o1의 Wordle 풀이능력 비교
2024.09.19제가 매일 빼먹지 않고 하는 활동 중에는 워들(Wordle)이라는 게임이 있습니다. 미국의 신문사 뉴욕 타임즈에서 제공하는 단어 게임입니다. 매일 자정 하나의 게임이 올라오고, 기본 규칙은 여섯 번의 시도 이내에 다섯 글자 영단어가 무엇인지 추리해서 맞추면 됩니다. 글자가 맞으면 해당 위치는 초록색으로 표시되고, 글자가 단어에 포함되지만 위치가 틀렸을 경우 노란색으로 표시되고, 글자가 단어에 없으면 회색으로 표시됩니다. 예전에 ChatGPT가 출시되고 GPT-4 모델이 탑재됐을 때, ChatGPT가 워들을 잘 풀수 있지 않을까 하는 생각을 했었습니다. 하지만 예상과는 달리, 어처구니 없는 실수들을 하면서 전혀 정답에 가까이 가지 못했습니다. 가장 흔한 실수는 특정 글자가 위치는 틀렸지만 단어 안에 포함..
OpenAI o1 모델로 한국인들만 알아보는 한국어 리뷰 파훼하기
OpenAI o1 모델로 한국인들만 알아보는 한국어 리뷰 파훼하기
2024.09.18얼마 전에 OpenAI o1 모델이 공개되면서 o1에 새롭게 강화된 다양한 기능들이 소개되었는데요, 그 중에 하나가 한국인들에게 큰 주목을 끌었습니다. 바로 일명 ‘한국인들만 알아볼 수 있는 리뷰’를 o1 모델이 해석하는 것을 선보였습니다. 구글에 ‘한국인들만 볼 수 있는 리뷰’와 같은 쿼리로 검색하면 각종 호텔 예약 웹사이트에서 한국인들만 읽어서 이해할 수 있는 리뷰들에 대한 글들이 보입니다. 한글과 한국어의 특성을 활용해서 기존의 번역기는 절대로 번역할 수 없는 글들이죠. 보통 이런식으로 리뷰를 남기는 이유는, 적어도 한국인들끼리는 별로인 숙박 업소를 피하고자하는 한국인의 정(?)이라고 볼 수 있겠죠. 보통 이런 리뷰를 남기는 방식은 Shift 키를 눌러서 가능한 모든 자음을 된소리로 바꾸거나 글자마..
OpenAI o1 모델이란?
OpenAI o1 모델이란?
2024.09.18최근 인공지능(AI) 분야에서는 단순한 응답을 넘어 복잡한 문제 해결 능력을 갖춘 모델들이 주목받고 있습니다. 그 중심에 있는 것이 바로 OpenAI의 새로운 모델 시리즈, o1입니다. 이 글에서는 대중들이 쉽게 이해할 수 있도록 o1 모델의 특징과 활용 가능성에 대해 설명하겠습니다. OpenAI o1 모델이란? OpenAI의 o1 모델은 GPT 계열 모델에서 한 단계 발전한 AI로, 특히 복잡한 문제를 해결하기 위해 설계되었습니다. 이름에서도 ‘GPT’를 붙이지 않았습니다. 기존 AI 모델들은 빠르고 간결한 응답을 제공하는 데 중점을 두었지만, o1 모델은 문제를 해결하기 위해 더 많은 시간을 들여 생각하고 다양한 접근 방식을 시도합니다. 이는 마치 사람이 문제를 해결할 때 여러 가지 방법을 고민하는 ..