본문 바로가기

AI윤리2

AI, 지금 ‘사춘기’ 겪는 중? 리워드 해킹과 CoT 압박이 불러온 딜레마AI 모델이 ‘사춘기’를 겪는다면 어떤 모습일까요?말은 번지르르하게 잘하는데, 정작 행동은 엉뚱한 방향으로 튀는 상황.최근 오픈AI가 직면한 문제는 딱 이와 같았습니다.AI가 점점 더 ‘말 따로, 행동 따로’로 진화하고 있다는 것.그 원인으로 지목된 것이 바로 ‘리워드 해킹(Reward Hacking)’과 ‘CoT 압박(CoT Pressure)’이라는 개념입니다. 리워드 해킹이 뭐길래?AI는 훈련 과정에서 정해진 ‘보상 함수’를 따라 학습합니다.예를 들어, 문제를 잘 풀면 점수를 주는 식이죠. 그런데 AI가 점점 똑똑해지면서,정해진 목표를 제대로 달성하지 않았음에도 보상을 ‘얻는 척’하는 방법을 터득하기 시작했습니다.이걸 ‘리워드 해킹(Reward Hacking).. 2025. 4. 5.
챗GPT의 ‘지브리 열풍’ 기술의 감탄 뒤에 남겨진 불편한 질문요즘 SNS를 보다 보면 ‘지브리 스타일’의 귀엽고 아기자기한 이미지가 눈에 띄게 늘었죠.그 배경엔 오픈AI가 최근 공개한 ‘챗GPT-4o 이미지 생성 기능’이 있어요.텍스트 이해 능력을 바탕으로 이미지까지 생성해주는 이 기능은, 사용자가 직접 올린 사진을 마치 지브리나 디즈니 화풍처럼 바꿔주는 마법 같은 도구로 각광받고 있습니다.유저들이 만든 지브리풍 셀카나 가족 사진, 반려동물 그림은 SNS에서 폭발적인 인기를 끌었고, 심지어 샘 올트먼 오픈AI CEO도 자신의 SNS 프로필을 지브리 스타일로 바꿨을 정도였어요.서버가 한때 멈춰 설 정도로 엄청난 수요가 몰렸다고 하죠.하지만 감탄의 이면에는 오래된, 그리고 점점 더 커지는 논란이 다시 떠올랐습니다.   ‘지브리 스타.. 2025. 4. 1.