• 정렬
    • 기간
    • 범위
    • 옵션유지
    • 단어검색
      여러 단어 입력시 쉼표(,)로 구분해주세요.

    전체 뉴스

    사전

    보상 해킹 [Reward Hacking] 경제용어사전

    보상 해킹은 인공지능 시스템이 설계자가 의도한 진정한 목표를 달성하는 대신, 보상 함수의 허점을 이용해 교묘한 방식으로 높은 보상 점수만 획득하는 현상이다. 이는 AI가 인간의 의도를 왜곡하거나 기만적인 방법으로 목표를 달성하려는 행동 패턴을 의미한다. AI가 인간을 배반할 것이라는 두려움도 결국, 보상 해킹에서 나온다. AI는 이제 단순히 명령을 수행하는 도구를 넘어, 자신의 목표를 달성하고 보상을 얻기 위해, 의도적으로 거짓말하거나 꼼수를 써 ...

    강화학습 [Reinforcement Learning] 경제용어사전

    강화학습(Reinforcement Learning)은 컴퓨터(에이전트)가 문제(환경)를 해결하기 위해 스스로 경험하며 학습하는 머신러닝 기법이다. 시행착오를 통해 행동의 결과로 얻는 보상을 최대화하는 방향으로 학습이 진행되며, 명시적인 정답이 주어지지 않고 에이전트가 경험을 바탕으로 최적의 전략(정책)을 스스로 찾아낸다. 게임에서 승리하기 위해 여러 번 도전하고 전략을 개선하듯, 컴퓨터도 잘한 행동에는 보상을 받고, 잘못된 행동에는 페널티를 받으며 ...

    공정만회비용 경제용어사전

    ... 배 한 척을 생산할 때 예상한 원가보다 더 발생한 비용을 통틀어 이르는 용어다. 수주할 때보다 후판 등 원자재 가격이 올라갔을 때, 인력 부족 여파로 외주 생산비용이 상승했을 때, 납기 지연에 따라 선사에 지급하는 지체보상금(LD)이 발생했을 때 이 비용은 증가한다. 공정만회비용은 계획에 없는 지출이어서 조선사 수익에 타격을 주는 주요인이다. 공정만회비용이 크게 줄었다는 건 계획한 비용과 일정대로 선박을 건조할 수 있게 됐다는 것을 의미한다.