본문 바로가기

전체 글49

ChatGPT에 질문을 해도 반응이 없을 경우 해결 방법 ChatGPT에서 간혹 질문을 해도 답변이 생성되지 않고 멈춰있을 때가 있다. 이 때는 일단, ChatGPT 화면에서 F12 키를 눌러 개발자도구 창에 진입한 후, 상단 메뉴바 '>>(더보기)' 버튼을 눌러 'Application' 메뉴를 클릭한다(크롬 브라우저 기준). 좌측의 Storage 메뉴의 Local storage를 클릭하여 드롭다운을 열고, 나오는 storage들에서 우클릭한 후 Clear 해준다. ChatGPT가 잘 작동하는 지 확인한다. 브라우저의 쿠키를 모두 지우면 해결되기도 하는데, 이 방법이 더 간편해 보인다. 2024. 3. 12.
콜로니 그래프(Colony Graph): 클라우드 서비스를 시각화하기 - 02 2024.03.10 - [🟢 Graph] - 콜로니 그래프(Colony Graph): 클라우드 서비스를 시각화하기 - 01 TL; DR 이전 포스트의 클라우드 시각화에서는, 클라우드 환경 전반에서 프로세스와 그 parent-child 계층 구조를 보여주며 다양한 규모에서 패턴을 탐색했다. 본 포스트에서는, 좀 더 나아가 시간 경과에 따른 프로세스의 변화 양상을 살펴본다. 이러한 변화 양상의 일부 순간을 포착하여 그래프로 표현하는 것을 원저자는 프로세스 스냅샷(process snapshot)이라 언급하고 있다. 원문 링크: https://www.brendangregg.com/ColonyGraphs/snapshots.html 살아있는 듯한 프로세스 스냅샷 마치 심장 박동이나 미세한 생명체처럼 보여 기괴해보일.. 2024. 3. 11.
콜로니 그래프(Colony Graph): 클라우드 서비스를 시각화하기 - 01 TL;DR 클라우드를 기반의 서비스를 운용하는 기업은 서비스의 규모에 따라 수십, 수백 개의 인스턴스를 관리하는 부담을 가지게 된다. 이번 포스트에서는, 그래프 표현을 이용해 클라우드의 프로세스를 시각화하고 이를 통해 클라우드 관리를 용이하게 하는 'Colony Graph' 방법론에 대한 Brendan Gregg의 포스트를 번역 및 분석해본다. 원문은 약 10년 전 작성된 오래된 포스트이지만, 클라우드 서비스에 대한 흥미로운 그래프 분석 양상을 제시하고 있다. 원문 링크: https://www.brendangregg.com/colonygraphs.html * 이해를 돕기 위한 의역이 포함됩니다. ** 이미지를 클릭하면 큰 이미지로 볼 수 있습니다. 콜로니 그래프(colony graph)*는 컴퓨터의 유기.. 2024. 3. 10.
검색증강생성(RAG) - 그래프 기반 벡터 인덱스 HNSW(Hierarchical Navigable Small World) TL;DR 이전 포스트에서는 역 인덱스 기반의 IVF 벡터 인덱스를 소개했다. IVF와 함께 벡터 데이터베이스에서 가장 많이 사용되고 있는 벡터 인덱스 알고리즘으로, 벡터 데이터를 계층형 그래프로 구성하여 표현하는 HNSW(Hierachical Navigable Small World)이 있다. 이 포스트에서는 HNSW를 이해하는 데에 필요한 개념들을 소개하면서, HNSW의 원리를 이해해보도록 한다. * HNSW 논문 링크(Malkov & Yashunin., 2016): https://arxiv.org/abs/1603.09320 목차 더보기 1. Small World 2. NSW(Navigable Small World) 3. Skip List 4. HNSW(Hierachical Navigable Small.. 2024. 2. 25.
OpenAI의 동영상 생성 모델 'Sora' Technical Report 읽어보기 * 이해를 돕기 위한 의역이 포함될 수 있습니다. * 각주나 이미지, 영상 등의 보조 자료는 원문 링크에서 확인 가능합니다. 원문 링크: https://openai.com/research/video-generation-models-as-world-simulators Video generation models as world simulators 세계 시뮬레이터로서의 비디오 생성 모델 February 15, 2024 We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable.. 2024. 2. 17.
검색증강생성(RAG) - 벡터 인덱스 기초 및 IVF 2023.11.01 - [🔵 AI & ML] - 검색증강생성(RAG) 이해하기 - 01. 벡터 DB 기초 2024.01.27 - [🔵 AI & ML] - 검색증강생성(RAG) 이해하기 - 02. Ragas를 이용한 RAG 파이프라인 평가 TL; DR RAG 프레임워크에서는, 빠른 벡터 검색을 위해 임베딩한 벡터들을 사전에 군집화 또는 계층화 해놓는다. 이를 통해, 검색 시 모든 벡터를 대조할 필요가 없도록 데이터를 구성하는데 이러한 데이터 구조를 이를 '벡터 인덱스' 라 한다. 벡터 인덱싱 방법으로는 IVF(역파일 인덱스)와 HNSW(계층적 탐색이 가능한 작은 세계) 알고리즘이 가장 잘 알려져 있는데, 여기서는 IVF를 중심으로 설명하면서 벡터 인덱스의 기초가 되는 개념들을 함께 소개한다. 목차 더보기 .. 2024. 2. 12.
데이터베이스 테이블 관계를 그래프로 시각화하기 TL;DR 데이터베이스를 운영하다보면, 데이터가 추가되면서 테이블 간의 관계가 복잡해져 그 관리가 어려워질 수 있다. 이 포스트에서는 Marco Perone의 글을 바탕으로 데이터베이스 내 테이블들의 관계를 그래프로 나타내어 보면, 데이터베이스 관리에 있어 어떤 유용한 인사이트를 얻을 수 있는 지 알아본다. 원문 링크: https://marcosh.github.io/post/2016/09/15/db-graph-analisys.html * 의역이 있을 수 있습니다. Database relations and graph visualization 데이터베이스 테이블 관계를 그래프로 시각화하기 프로젝트의 크기가 점점 커질 때, 이를 여러 개의 하위 프로젝트로 분할하는 것이 바람직한 시점까지 성장하는 경우가 종종 .. 2024. 2. 3.
검색증강생성(RAG) - Ragas를 이용한 RAG 파이프라인 평가 2023.11.01 - [🔵 AI & ML] - 검색증강생성(RAG) 이해하기 - 01. 벡터 DB 기초 개념 TL;DR 이전 포스트에서 벡터 DB와 검색 증강 생성(RAG)에 대한 간단한 개념을 알아보았다. 그럼, 벡터 DB를 이용해 구축한 RAG 파이프라인을 어떻게 평가할 수 있을까? 언어 모델 자체의 평가에 있어서는 여러 지표가 알려져 있지만, 최근 주목받기 시작한 RAG 분야에 특화된 평가 지표는 확립되어 있지 않은 것 같다. 이 포스트에서는, RAG 파이프라인 평가 프레임워크인 Ragas를 참고하여 RAG의 평가 방법을 알아본다. * 이해를 돕기 위한 의역이 포함될 수 있습니다. Ragas Ragas(Retrieval-Augmented Generation Assessment)는 RAG 파이프라인.. 2024. 1. 27.
LLM 이해하기 - LLM의 기초 개념 TL;DR ChatGPT가 불러온 LLM과 AI의 시대는 아직도 계속되고 있으며, LLM은 계속 진화하고 있다. 이제 SF 창작물에서만 보던 AGI(Artificial General Intelligence) 시대가 점점 다가오고 있는 것 같다. 이 시리즈는 LLM을 기초부터 시작하여 다양한 시각에서 관찰해 나가며 이해하는 것을 목적으로 한다. 이 포스트는 Andrej Karpathy와 정형원 님, 고우영 님의 교육 자료를 주로 참고했고, 그 외 다양한 자료를 참고하여 작성되었음을 미리 밝힌다. Andrej Karpathy(OpenAI, Tesla)의 'Intro to Large Language Models' 영상 링크: https://www.youtube.com/watch?v=zjkBMFhNj_g 정형원.. 2024. 1. 14.
Microsoft, 2.7B의 경량 규모 언어 모델 출시: Phi-2 TL;DR Microsoft에서 Phi-1.5의 후속 모델을 출시했다. 이미 Orca라는 비교적 작은 사이즈의(7B, 13B) 언어 모델을 출시했었지만 이번엔 그보다 더욱 작은 2.7B 사이즈의 모델이다. 이는 개인이나 작은 사업체에서도 충분히 운용 가능한 사이즈로 볼 수 있다. AI 모델 운용 인프라 보유 능력이 비대칭적으로 변해가면서 경량화 LLM 모델의 수요가 높아지고 있는 가운데, Phi-2 모델이 경량화 LLM에서 주도적인 입지를 가질 수 있을 지 기대된다. Phi-2: The surprising power of small language models Phi-2: 작은 언어 모델의 놀라운 힘 By Mojan Javaheripi , Senior Researcher Sébastien Bubeck ,.. 2024. 1. 10.
경량화 LLM을 이용한 SQL 생성기를 만들어보자 TL;DR 최근 양자화(Quantization) 등의 방법으로 LLM 경량화가 이루어지면서, 일반 사용자들이 LLM을 이용한 서비스를 구축하기가 한결 수월해졌다. 이 포스트에서는 양자화한 7B 수준의 LLM을 기반으로, 자연어 질의를 SQL로 변환해주는 생성기를 만들어 본다. 본 튜토리얼은 Colab Pro(또는 Pro Plus)의 T4 GPU 및 고용량 RAM 환경에서 수행되었다. 구글 Colab(이하 코랩)은 기본적으로 임시 디렉토리에 파일을 저장하므로, 만약 작업 중 파일을 저장하거나 불러올 때는 구글 드라이브 경로를 지정해주어야 합니다. 드라이브 마운트 후 cd 명령어를 이용해 경로를 설정해줍니다. 필요한 경우에만 실행하면 됩니다. from google.colab import drive drive.. 2024. 1. 6.
AWS Solutions Architect Associate(SAA-C03) 기출문제 정리 - 04 인덱스 요구사항 솔루션 2-01 AWS로 마이그레이션해야하는 Windows 앱 여러 가용영역에 배포된 EC2 Windows에 함께 연결된 공유 Windows 파일 시스템이 필요 Windows 파일 서버용 FSx를 구성하고, 각 Windows EC2에 FSx 파일 시스템 탑재 EFS는 NFS 프로토콜로 리눅스 OS 인스턴스 용도이며, EBS는 동일 가용 영역의 EC2만 연결 가능 2-02 AWS를 사용하여 이벤트 데이터를 수신하는 대로 처리하며, 특정 순서로 작성 운영 오버헤드를 최소화하는 솔루션 필요 Simple Queue Service(SQS) FIFO 대기열 생성 대기열의 메시지를 처리하도록 Lambda 함수 설정 Simple Notification Service(SNS)와 혼동하지 않도록 주의 2-.. 2024. 1. 3.