| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- 엠프로
- 제발쉽게좀가르치자
- DataProcessing
- MPRO
- ML/DL
- 불법마약특별단속 #부산지방경찰청
- RL
- LTSF
- transformer
- HY7714
- 도커로 깃블로그 만들기
- 벨만방정식
- Neo4j
- 강화학습으로주식하기
- 오토트레이딩
- 흥미붙이기
- TimeSeries
- 프레딧
- ML
- NLinear
- AI
- mlflow
- 강화학습
- KnowledgeGraph
- CERTIFICATIONS
- DL
- DLInear
- de
- 지식그래프
- graphdb
- Today
- Total
목록전체 글 (56)
상황파악
https://huggingface.co/blog/codelion/optimal-model-architecture The Optimal Architecture for Small Language ModelsI just don't think your depth-width results have enough samples for what you have tried to fit to them, it's like you tried to create a narrative that exactly fitted each one with no noise, but with 7 results and a complicated explanation it's like you ovehuggingface.co SLM을 위한 다양한 연..
연초부터 프로젝트를 통해 공부한 Neo4j에 대한 자격증이 있음을 알게되었다해당 자격증이 어떤 내용을 담고 있는지, 그리고 이를 취득하기 위해 어떤 준비를 해야 하는지 기록해보려 한다 참고로 자격증은 Neo4j 아카데미에서 발급해고, 아래 링크를 통해 확인할 수 있다https://graphacademy.neo4j.com/ Free, Self-Paced, Hands-on Online TrainingLearn how to build, optimize and launch your Neo4j project, all from the Neo4j experts.graphacademy.neo4j.com 종류 Neo4j cetification 은 총 2가지로 Neo4j Certified Professional 과 ..
한참 LLM에 관심이 많은 요즘 ML에 대한 본질을 점점 잊어가는 기분이 듭니다현재의 상황을 점검하기 위해 회고를 하며 놓치고 있는 것은 무엇인지, 예전에는 어떤 마음으로 일을 했었는지 되짚어보려 합니다 사족으로 데이터 사이언티스트로써 업무를 수행하는 것은 정말 많은 창의력과 에너지를 요구하는 것 같습니다 쉽게 해결할 수 있는 다양한 방법이 있음에도 자존심 때문에 어려운 기술에 도전해보는것어려운 문제지만 간단히 나아가는 방법 이 중간 타협점을 찾는것이 참 쉽지않습니다 시작부터 다른길로 샜는데, 다시 집중해보겠습니다 풀어야 할 문제 우선 저는 유통에서의 수요예측 문제를 해결해야 했습니다저에게 주어진 일은 명료했습니다 물건을 팔기위해 발주를 넣어야 하는데, 얼만큼 주문을 넣어야 할까요? 아마 많은 자..
호랑이는 죽어서 가죽을 남기고 사람은 죽어서 이름을 남긴다.사람이 죽으면 이름으로 기억된다는 얘기다. 그 이름을 이루는 많은 기억과 감정들이 있을 것이다.하지만 이반 일리치는 다른 사람들에게 자리로 기억되었다. 그의 직책, 그의 터전, 그가 죽기 전까지 괴로워했던 방까지. 어떤 사람이었는지에 대한 기억은 세심하게 다루지 않는다. 이미 행동으로 다른 사람의 심정을 이해할 수 있기 때문일지도 모른다. 그렇다면 사람은 어떤 것으로 기억이 되는가? 나는 그사람이 진심을 다했던 무언가로 기억된다고 생각한다. 나눔을 실천했던 사람, 약탈과 강요를 일삼았던 사람, 조용히 지냈던 사람. 너무 당연하다. 그 사람의 행동이 모여 그 사람의 이름으로 불리운다. 하지만 생각해 보면 이름이라는 것은 너무나 한계가 명확하다..
나는 추상적인 개념은 어렵다 그래서 계산할 수 있는 데이터로 봐야 이해가 쉽다 난 개발자니까 수식과 추상적인 개념만 가득했던 Q-learning을 임의의 값을 통해 어떻게 변화하는지 살펴보겠다 도대체 Q-learing이 뭐냐? 내가 하는 행동에 대한 가치가 얼마인지를 배우는 것이다 Q = Quality 가치를 배운다 라는게 정확히 무슨 뜻인지 알기위해 강화학습의 기본 개념을 다시 짚어보자 강화학습의 기본 골조는 상황이 주어지고, 그에 맞는 행동을 하고, 보상을 받으면서 배우는 것이다 OX게임을 예시로 들면, 사람은 한줄에 동일한 기호를 채우면 이긴다는 것을 알고 있지만 에이전트는 알지못한다 그냥 알려준 행동에서 고르는 것이다 물론 위 같은 경우는 로직자체가 잘못되어서 이상한 에러를 뱉은 것..
제 인생 가치관입니다 저는 근무시간에 열심히 일을 해서 투자금을 마련하고, 컴퓨터는 제가 일하는 동안 주식을 돌려서 제 돈을 불려주는 아름다운 공생관계를 구축하는 것이 이 프로젝트의 목표입니다 Proj Due Date향후 12주간 프로젝트를 진행할 예정입니다 마감일자가 되면 어떻게든 마무리 짓고 다음 프로젝트로 개선하는 방향으로 마무리 할 겁니다 Proj Goal강화학습의 이론을 토대로 동작하는 모델을 만든다모델이 주식 거래를 한다이걸 24시간 돌리는 환경을 만든다 (내가 잘때 미주를 할 수 있게끔)(돈을 번다) 간단하게 적었지만 나름의 마일스톤인 셈이다 목표 수익률ML에서 분류 모델의 성능을 평가하기 위한 지표로 AUC 스코어를 쓰는데, 핵심은 이거다 자고로 ML을 썻다면 '랜덤으로 돌려도 너..
공부하다 너무 화가나서 다시 글을 써본다대체 왜 강화학습을 쉬운 말로, 수식 없이, 이해되기 쉽게 설명하는 사람이 왜 한명도 없나 (물론 이전 내 설명자료 포함. 그래서 더 화남) 수식으로 설명하면 명확하기 때문에 이 분야를 공부하는 사람들의 스타일이 아닐 수 있는건 이해하는데취미로 한번 해볼까 하는 사람들이 진입하기에는 너무 숨이 막힌다 나처럼 멍청한 사람을 쉽게 가르치는 사람이 도대체가 왜 한명도 없냐 이말이야덧셈 뺄셈 하다가 갑자기 미분가르치는데 중간 내용 어디갔냐 하면 수식을 보면 된단다 이게 무슨 소리야 대체 그래서 내가 최대한 추리고 추리면서 내용 다 틀려먹더라도 일단 이해가 되기 쉽게 적고 더 공부하면서 틀린 부분을 수정해가야 겠다 아니 공부도 일단 재미가 있어야 할 거 아니냐이건 뭐 연구..
MDP 구성요소이전 내용에서 MDP 구성요소로 상태,행동,보상을 설명했다. 조금 더 자세히 설명하자면 상태, 행동, 보상함수, 상태 변환 확률, 감가율 총 5개의 요소로 구성되어 있다. 상태 (State) 상태와 행동은 에이전트가 현재 환경안에서 어떤 상태에 놓여있는지 (위치는 어디인지, 지금 어디로 이동하고 있는지, 주변에 바람은 어떻게 부는지 등) 같은 관찰 가능한 상태의 집합 ($S$) 이다. 책에서 설명하는 예시를 가져왔다그리드월드에서 상태값은 좌표값이다. (왜 (1,1) 우측이 (1,2) 가 아니라 (2,1) 인지는 모르겠다)5x5 행렬이 있다고 했을 때, 그리드월드의 상태 집합은 $S = {(1,1),(1,2),(1,3),...,(5,5)}$ 로 표시할 수 있다.에이전트는 시간에 따라 2..