학습/AI 2

Ollama + deepseek 첫 질문이 너무 느릴 때

지난 포스팅에서 ollama를 이용해 로컬에서 deepseek 모델을 실행하고Chatbox를 이용해 gpt를 사용하는 것처럼 사용해보았습니다. 그런데 그렇게 설정을 해두고 시간이 조금 흐른 후에 다시 질문을 했을 때속도가 확연히 느려진 것을 확인하실 수 있습니다.그 이유는 모델을 gpu나 cpu에 로딩하는 시간이 필요하기 때문입니다. 이번 포스팅에서는 첫 질문이 너무 느린 문제를 해결하기 위해모델을 바로 언로드 하지 않도록 설정하는 방법을 공유하려고 합니다. 기본 설정 확인하기powershell에서 ollama ps라는 명령어를 입력하면 위와 같이 UNTIL 값을 확인할 수 있습니다.이 값이 마지막 질문을 답하고 언제까지 모델을 유지할 지 설정하는 값입니다.그래서 5분이 지나면 위와 같이 GPU 메모리에..

학습/AI 2025.02.13

ollama + deepseek 설치해서 정보유출 걱정 없이 사용하기

요즘 Deepseek가 화제입니다.중국이 오픈소스를 했다는 것도 정말 의외였습니다.그래도 은연 중에 개인정보 걱정을 할 수 있는데요.오늘은 자신의 PC에 모델을 설치해서 deepseek을 안전하게 사용하는 방법을 공유하려고 합니다. ollama 설치ollama는 https://ollama.com 에 접속해서 다운로드하면 됩니다.접속해서 보이는 download 버튼을 눌러 자신의 운영체제에 맞는 ollama를 다운로드 하세요. 설치가 완료되면 ollama가 백그라운드로 실행됩니다.알림을 누르면 오른쪽과 같이 powershell이 실행되면서 ollama가 정상적으로 설치된 것을 확인할 수 있습니다.ollama 설정 (선택사항)저는 C 드라이브 용량이 적어서 다른 드라이브에 ollama model을 다운로드하..

학습/AI 2025.02.07
반응형