AI/Survey 6

Lost in Middle 문제의 원인과 해결방안

개요Lost in Middle 현상은 대형 언어 모델(LLM)이 긴 텍스트를 처리할 때 발생하는 주목할 만한 문제이다. 이 현상은 모델이 텍스트의 시작과 끝 부분에 있는 정보는 상대적으로 잘 기억하고 활용하는 반면, 중간 부분에 위치한 정보는 상대적으로 잘 처리하지 못하는 경향을 말한다. 이는 장문의 문서를 분석하거나, 긴 컨텍스트에서 정보를 추출해야 하는 상황에서 중요한 제약으로 작용한다. 본 글에서는 Lost in Middle 문제의 원인을 심층적으로 분석하고, 이를 해결하기 위한 다양한 접근법을 제시한다.설명Lost in Middle 현상은 2023년 스탠포드 대학과 버클리 대학 연구팀이 "Lost in the Middle: How Language Models Use Long Contexts" 논문..

AI/Survey 2025.05.13

LangChain의 작업 처리: invoke(ainvoke), stream(astream), batch(abatch)에 대한 분석

개요LangChain은 대규모 언어 모델(LLM)을 활용한 애플리케이션 개발을 위한 프레임워크로, 다양한 모델 호출 방법을 제공한다. 특히 invoke(ainvoke), stream(astream), batch(abatch) 메서드는 LangChain에서 모델과 상호작용하는 주요 인터페이스이다. 이 메서드들은 각각 동기 및 비동기(async) 방식으로 제공되어 다양한 사용 사례와 성능 요구사항을 충족한다. 이 글에서는 LangChain의 이러한 핵심 메서드의 기능, 사용법 및 최적화 방법에 대해 상세히 살펴본다.설명LangChain은 다양한 LLM과의 통합을 단순화하는 파이썬 라이브러리로, v0.1.0 버전 이후 인터페이스가 크게 개선되었다. 이 프레임워크는 모델 호출을 위한 세 가지 주요 메서드를 제공..

AI/Survey 2025.05.08

합성곱 신경망(CNN)

개요합성곱 신경망(Convolutional Neural Network, CNN)은 주로 이미지 처리와 컴퓨터 비전 분야에서 광범위하게 사용되는 딥러닝 아키텍처이다. 시각적 데이터의 패턴 인식에 특화된 구조로, 인간의 시각 체계에서 영감을 받아 설계되었다. 2012년 AlexNet이 ImageNet 경진대회에서 우승한 이후, CNN은 컴퓨터 비전 분야의 중추적 기술로 자리 잡았다.설명CNN은 일반적인 완전 연결 신경망과 달리 합성곱 계층(Convolutional Layer), 풀링 계층(Pooling Layer), 그리고 완전 연결 계층(Fully Connected Layer)으로 구성된다. 합성곱 계층에서는 필터(또는 커널)가 입력 이미지를 스캔하면서 특징을 추출한다. 이 과정은 수학적으로 합성곱 연산으..

AI/Survey 2025.04.29

순환 신경망(RNN)

개요순환 신경망(Recurrent Neural Network, RNN)은 순차적 데이터를 처리하기 위해 설계된 인공 신경망의 한 종류이다. 시퀀스 데이터의 시간적 의존성을 효과적으로 포착할 수 있는 구조를 가지고 있어 자연어 처리, 음성 인식, 시계열 데이터 분석 등 다양한 응용 분야에서 활용된다. RNN은 과거 정보를 기억하고 현재 입력과 함께 처리할 수 있는 메모리 메커니즘을 통해 컨텍스트를 유지한다.설명RNN은 기존의 피드포워드 신경망과 달리 입력을 순차적으로 처리하고 내부 상태(hidden state)를 통해 정보를 유지한다. 기본적인 RNN의 수학적 표현은 다음과 같다:h_t = f(W_x * x_t + W_h * h_{t-1} + b_h)y_t = g(W_y * h_t + b_y)여기서:h_t..

AI/Survey 2025.04.28

AI분야에서의 Ontology

개요인공지능(AI) 분야에서 온톨로지(Ontology)는 지식 표현과 추론의 핵심 요소로, 시맨틱 웹, 자연어 처리, 지식 그래프 등 다양한 영역에서 활용된다. 온톨로지는 특정 도메인의 개념과 그 관계를 형식적으로 정의하는 명세로, AI 시스템이 지식을 체계적으로 이해하고 활용할 수 있는 기반을 제공한다. 최근 대규모 언어 모델(LLM)과 결합하여 GraphRAG와 같은 첨단 기술로 발전하면서 AI의 지식 표현과 추론 능력을 획기적으로 향상시키고 있다.설명AI 분야에서 온톨로지는 크게 두 가지 관점에서 접근할 수 있다. 첫째, 지식 표현(Knowledge Representation)의 관점에서 온톨로지는 기계가 이해하고 처리할 수 있는 형태로 도메인 지식을 구조화한다. 둘째, 추론 엔진(Reasoning..

AI/Survey 2025.04.26

RAG vs GraphRAG

개요검색 증강 생성(Retrieval Augmented Generation, RAG)과 그래프 검색 증강 생성(Graph Retrieval Augmented Generation, GraphRAG)은 대규모 언어 모델(LLM)의 성능을 향상시키기 위한 두 가지 혁신적인 접근 방식입니다. 이 두 기술은 외부 지식을 활용하여 LLM이 생성하는 콘텐츠의 품질, 정확성 및 관련성을 높이는 데 중점을 둡니다. 본 글에서는 각 접근 방식의 기본 개념, 주요 특징, 장단점 및 실제 적용 사례를 비교 분석합니다.설명RAG(Retrieval Augmented Generation)RAG는 2020년 Facebook AI Research에서 처음 소개한 기술로, 외부 지식 소스에서 관련 정보를 검색하고 이를 LLM의 프롬프트..

AI/Survey 2025.04.25
728x90
반응형