728x90
반응형
SMALL

분류 전체보기 103

Reinforcement Learning_ Markov Decision Process

안녕하세요,오늘은 토론토대학교 강화학습 수업을 들으면서 이해가 되지 않는 부분이 있어 유튜브 혁펜하임으로 공부한 내용을 업로드합니다. Markov Decision Process 중요한 성질 : State와 Action이 Random하다.s1와 주어져 있으면 s0과 a0을 알건 모르건 상관없이 a1의 확률이 정해진다. 두다리는 지워주고, 한다리는 남긴다. 1. P(a1 | s0, a0, s1) 이면 P(a1| s1)만 남는다. (여기서는 s1만 알면 a1이 되기에) 2. P(s2 | s0, a0, s1, a1) 이면 P(s2| s1, a1)만 남는다. (여기서는 s1과 a1을 알아야 s2가 되기에)  1번 >> Policy : State에서 어떤 action을 할지에 대한 분포가 정책이다.   2번 >>..

에피소드19. U of T life 토론토대학교 파견 2주차 (1월 10~13일)

안녕하세요, 「University of Toronto AI 융합 교육 프로그램」 으로 토론토에 파견온 고군분투기 입니다. 링크 : https://www.msit.go.kr/bbs/view.do?sCode=user&bbsSeqNo=100&nttSeqNo=3178946 - 과학기술정보통신부과학기술정보통신부, 정보통신기획평가원, 서강대학교는 6대 디지털 혁신기술 분야 고급인재 육성을 위해 프로젝트형 글로벌 역량강화 사업 「University of Toronto AI 융합 교육 프로그램」의 2025년www.msit.go.kr 매일매일 블로그에 적으려했지만 적응도 해야하고, 과제 및 연구실 모니터 준비 등 해야할 것들이 많아 일주일에 한번~ 두번 정도 작성할 것 같습니다.저의 U of T Life는 유튜브와 네이..

4. U of T Life 2025.01.16

위니브 엠버서더 활동. 1월 위-니드 이벤트

안녕하세요,오늘은 위니드 4기 엠버서더로 활동하고 있는 "고군분투기"입니다. 1월 위-니브 이벤트로 넘어가기 전에 간단하게 위니브가 어떤 곳인지, 그리고 엠버서더에 대해 소개해드리고 가도록 하겠습니다. 위니브(Weniv)링크 : https://weniv.co.kr/위니브는 ICT 교육 컨텐츠 기업입니다. 지역과 가진 것에 차등 없이 누구나 ICT 교육을 받을 수 있도록 진로, 직업, 진학, 취업의 길을 열어갈 수 있도록 도와줍니다.  위니브 엠베서더 링크 https://ambassador.weniv.co.kr/ 위니브 엠버서더개발자로서의 성장을 원한다면? 위니브 엠버서더ambassador.weniv.co.kr 위니브 엠베서더란?위니브 엠버서더는 3개월 동안 위니브의 다양한 콘텐츠와 강의를 체험하고 홍보하..

[U of T.Reinforcement Learning] Q-Learning, Greedy, exploration, exploitation, discount factor, 그리디, 탐색, Q-러닝

안녕하세요,오늘은 토론토대학교 강화학습 수업을 들으면서 Q-Learning 부분에 대해 유튜브 혁펜하임으로 공부한 내용을 업로드합니다. Reinforcement Learning 이란, 맛집 찾기 이다. Q-Learning (Greedy action)맛집을 찾을 때, Q-Learning은 Greedy aciton(탐욕행동?)을 씁니다. 이동을 하면서 점수를 매길 것이고, 점수가 가장 큰 쪽으로 이동하는 것이 Greedy Action입니다.처음에는 0이다.위의 X표시의 모든 S(State, 상태)는 다 0이다. 맛집에 들어가면서 에피소드가 끝난다.  첫번째 에피소드맛집에 들어가면 R=1 리워드를 받는다. 위로 가면 리워드를 받기에 위쪽에 1 표시. 두번째 에피소드이동할 때, 오른쪽으로 고르는 동시에 Q-Le..

[U of T. Statistical Learning] Paper : Storks Deliver Babies, 가설검정

안녕하세요오늘은 토론토대학교 수업 중 Reading Assignment 를 진행하는 과정에서 오랜만에 다시 공부한 가설검정에 대해 적어보려합니다.Paper  : Storks Deliver Babies (p = 0.008) 상관관계와 인과관계의 차이에 대해 설명한 논문입니다.유럽 17개국의 황새 개체수와 출생률 간의 상관관계를 분석했는데요. 두 변수(황새 개체수와 출생률) 사이에 통계적으로 유의미한 상관관계가 있음을 발견했습니다. 쉽게 설명하자면, 황새의 개체수가 많을수록 출생률도 높은 경향이 있다는 것입니다.하지만 이러한 결과가 "황새가 아이를 가져다준다"를 의미하지는 않는다고 강조합니다. 다시 말하자면, 두 변수 사이에 상관관계가 존재하더라도 이것이 인과관계를 의미하지 않는다는 것이죠. 짧게 종합하자면..

[CIFAR] AI Safety, first event of 2025

안녕하세요.오늘은 CIFAR 2025년 첫번째 이벤트인 AI Safety 일정에 대한 소개 및 링크에 대해 안내드리려 합니다. 토론토에 있으면서 CIFAR 및 여러 AI Virtual event에 대해 종종 업로드 하겠습니다. 연사U of T & Vector institute의 Nicolas ParernotMontreal University의 Cathrine Regis퀘백 AI institute의 Mila  내용 Canada`s role in shaping the future of AI Safety 일시2025년 2월 4일시간 : 동부시간 12-1시 PM 위치가상 예약 링크https://cifar.ca/events/cifar-talks-ai-safety/?utm_source=linkedin&utm_med..

에피소드 18. Data Science 강의, OPS 강의, CARTE OT, 점심, 아이스하키

안녕하세요,오늘은  「University of Toronto AI 융합 교육 프로그램」 토론토 파견 개강 4일차 입니다. 링크 : https://www.msit.go.kr/bbs/view.do?sCode=user&bbsSeqNo=100&nttSeqNo=3178946 - 과학기술정보통신부과학기술정보통신부, 정보통신기획평가원, 서강대학교는 6대 디지털 혁신기술 분야 고급인재 육성을 위해 프로젝트형 글로벌 역량강화 사업 「University of Toronto AI 융합 교육 프로그램」의 2025년www.msit.go.kr  오늘은 아침 9시부터 Data Science강의가 있어서 부지런히 움직였어요.저의 U of T Life는 유튜브와 네이버클립에도 있으니 많관부! 네이버클립 : https://m.blog...

4. U of T Life 2025.01.11

에피소드17. 캐스모 책상, 토론토대학교 MDP강의, Dining hall, Rexall

안녕하세요,오늘은  「University of Toronto AI 융합 교육 프로그램」 토론토 파견 개강 3일차 입니다. 링크 : https://www.msit.go.kr/bbs/view.do?sCode=user&bbsSeqNo=100&nttSeqNo=3178946 - 과학기술정보통신부과학기술정보통신부, 정보통신기획평가원, 서강대학교는 6대 디지털 혁신기술 분야 고급인재 육성을 위해 프로젝트형 글로벌 역량강화 사업 「University of Toronto AI 융합 교육 프로그램」의 2025년www.msit.go.kr   오늘은 월요일날 들었던 MDP강의를 듣고 Dining hall에서 학식을 먹고 Rexall에 다녀왔습니다.저의 U of T Life는 유튜브와 네이버클립에도 있으니 많관부! 네이버클립 ..

4. U of T Life 2025.01.10

에피소드16. U of T 개강 둘째날 수업과 인턴 거절, 로버츠 도서관, 기념품샾, 다운타운 winners

안녕하세요,오늘은 2025 Winter term 개강 둘째날입니다. 토론토대학교 파견과정으로 듣는 필수수업 3과목 외에 1과목은 선택으로 할 수 있어서 신청한 선택과목을 들으러 갔습니다. 수업명은 Learning with Graphs and Sequences 입니다.그래프에 관심이 있기도 하고, 현지 학생들과 함께 수업을 들어보고 싶어서 신청하였습니다. 그럼 지금부터 저의 하루를 적어보겠습니다. 저의 U of T Life는 유튜브와 네이버클립에도 있으니 많관부! 네이버클립 : https://m.blog.naver.com/icanry/clip/7101663유튜브 : https://www.youtube.com/@AIdeats/shorts  오전 9시 수업이라 아침에 간단히 콘도 헬스장에서 계단 12분, 턱걸..

4. U of T Life 2025.01.09

에피소드 15. U of T 개강 첫날 그리고 강화학습, Book store, GYM

안녕하세요! 오늘은 토론토대학교 2025 Winter term 개강날입니다.12월 31일날 도착했으니 일주일도 채 지나지 않았는데 개강이 다가왔습니다. 오늘 수업은 강화학습 수업입니다. 정식 명칭은 DYN & DIST Decision Making 입니다.교수님께서 다음학기부터 강의명을 Multiple agent reinforcement Learning으로 변경하신다고 합니다. 오늘 수업은 12시부터 2시까지 2시간동안 진행된 수업이었습니다.  그럼 저의 하루를 소개해보도록 하겠습니다. 저의 U of T Life는 유튜브와 네이버클립에도 있으니 많관부! 네이버클립 : https://m.blog.naver.com/icanry/clip/7101663유튜브 : https://www.youtube.com/@AId..

4. U of T Life 2025.01.07
728x90
반응형
LIST