분류 전체보기 (82) 썸네일형 리스트형 [후기] Devocean 10월 Tech 세미나 - 2023년의 딥러닝과 LLM 생태계(신정규) [전반부] 출처 : 2023년의 딥러닝과 LLM 생태계 (sk.com) 2023년의 딥러닝과 LLM 생태계 33차 Tech 세미나 진행합니다. 이번 Tech 세미나는 “2023년의 딥러닝과 LLM 생태계”에 대해 준비하였습니다. 2018년 트랜스포머 이후 시퀀스 예측 기반의 딥 러닝 모델은 엄청난 발전을 이루었 devocean.sk.com [Agenda] 1. 2023년 거대 언어 모델의 대두 2. 거대 언어 모델 기반의 응용 사례 3. 거대 언어 모델 기반 서비스의 난제 4. 2023년 초, 중순의 변화의 시사점과 향후 방향 [발표자] 신정규 현) 래블업 주식회사 대표 - Google Developer Experts (ML분야), Google For Startup Accelerator Mentor - SW산업발전.. Over Sampling for Regression 출처 : https://towardsdatascience.com/strategies-and-tactics-for-regression-on-imbalanced-data-61eeb0921fca 0. Data Imbalance(데이터 불균형) 데이터 불균형은 현실 세계의 데이터에서 자주 일어나는 문제입니다. 데이터는 종종 편향된 분포를 보여주지만 현재 사용되는 대부분의 머신러닝 알고리즘은 각 대상 범주(분류)에 대해 균일한 분포를 가정하여 설계되었습니다. 한편으로, 많은 작업들이 타겟 값(변수)이 연속적인 값을 갖거나 무한한 값을 갖는 경우를 포함하여 (회귀), 클래스 간에 엄격한 경계가 존재하지 않는다는 것을 유념해야 합니다. (예: 나이 예측, 깊이 추정 등). 실생활에서 소수 클래스(minority cl.. 폴더 내 파일 트리 & 서브 폴더 내 파일들을 하나의 폴더로 이동 오늘은 윈도우 환경에서 나눔 글꼴을 설치하려다 불편함을 느껴서 찾아본 여러 폴더 안에 있는 파일들을 하나의 폴더로 합치는 파이썬 코드를 정리해 보았습니다. https://hangeul.naver.com/font 네이버 글꼴 모음네이버가 만든 150여종의 글꼴을 한번에 만나보세요hangeul.naver.com이 사이트에서 나눔 글꼴을 설치하려다 보니 하나의 압축 파일에 윈도우용 폰트(ttf)와 맥용 폰트(otf)가 함께 있더라구요. 그리고 한번에 모든 파일을 설치하려면 각 폰트 별 폴더를 찾아가고, 폴더 안에서 ttf 폴더를 눌러야하는 불편함이 있었어요. 필요(불편?)은 발명의 어머니그래서 방법을 찾아 보았습니다! 우선은 폴더 내 하위 폴더를 포함한 파일들 리스트를 보고, 각 폴더 내에서 ttf 확장자를 .. [Linux] 폴더 내 모든 파일 zip 파일로 압축 1. 폴더 내 모든 파일 압축하기 zip -r .zip zip: zip 아카이브를 생성하기 위한 명령 -r: zip 명령에게 지정한 폴더 내의 모든 파일과 하위 폴더를 재귀적으로 포함하도록 지시 .zip: 결과로 생성할 zip 파일에 주고 싶은 이름. 을 원하는 파일 이름으로 대체 : 압축할 폴더의 경로 를 실제 경로로 대체 (예시) zip -r my_folder.zip /path/to/folder 2. zip 파일 압축 풀기 unzip my_folder.zip -d /path/to/destination 기본적으로 unzip 명령은 zip 파일의 내용을 현재 작업 디렉토리로 추출합니다. 특정 디렉토리로 추출하려면 -d 플래그 다음에 대상 디렉토리 경로를 지정할 수 있습니다: 이렇게 하면 my_folder.. [python] timestamp 현재 일자/시각 문자열로 출력(한국 표준시 KST) 이 코드는 먼저 pytz 모듈을 사용하여 'Asia/Seoul' 시간대를 나타내는 객체를 생성합니다. 그런 다음 datetime.now() 함수를 호출하여 현재 시간을 해당 시간대로 가져오고, strftime() 함수를 사용하여 원하는 형식으로 포맷팅하여 출력합니다. # 필요한 라이브러리를 불려옵니다. from datetime import datetime import pytz # KST 시간대 객체 생성 kst_timezone = pytz.timezone('Asia/Seoul') # 현재 시간을 KST로 가져오기 current_time = datetime.now(kst_timezone) # 현재 시간을 포맷팅하여 출력 print("현재 시간 (KST):", current_time.strftime("%Y-.. [Python] Lambda 함수 사용법(for 데이터분석가) 안녕하세요! 오늘은 파이썬을 사용할 때 유용한 람다 함수에 대해 설명한 글을 간단히 소개드리려 해요! Lambda 함수는 익명 함수라고도 하며 이름 없이 정의됩니다. 이러한 함수는 완전한 함수 정의를 작성할 필요 없이 함수를 신속하게 정의해야 하는 상황에서 특히 유용합니다. 일반적인 파이썬 함수는 아래와 같이 정의됩니다. 아래 예시는 x와 y 2개 값을 입력받아 두 값을 더해주는 add라는 함수를 정의하고 사용해 본 예시예요. def add(x, y): return x + y ''' add(10, 7) 17 ''' 이때 반드시 함수에는 이름과 입력값, 그리고 출력값(반환값, 리턴값)이 있어야 합니다. 람다 함수를 살펴보기 전에 위의 구조를 한번 다시 기억해 주세요! 람다 함수는 익명함수라는 이름답게 이름.. 실무에 바로 쓰는 일잘러의 엑셀 데이터 분석(제이펍) 기본정보 저자 에이블런(지나, 제임스) 출판사 제이펍 쪽수 268쪽 독서기간 2023년 3월 매체 종이책 목차 [1장 | 데이터로 말하는 데이터 리터러시] 1.1 데이터 리터러시란? 012 1.2 기업 및 단체의 데이터 분석 활용 사례 026 [2장 | 필요한 데이터, 어디서 찾고 어떻게 불러올까?] 2.1 누구나 사용하는 공공데이터 활용하기 032 2.2 데이터 크롤링으로 웹페이지 데이터 수집하기 043 2.3 API로 빅데이터를 손쉽게 불러오기 047 [3장 | 엑셀 파워 쿼리를 이용하여 데이터 가공하기] 3.1 분석보다 중요한 데이터 전처리 060 3.2 열 분할 및 텍스트 추출하여 데이터 통합하기 064 3.3 서로 다른 파일에 있는 시트 통합하기 078 3.4 조건 열 기능 활용하여 여러 범위 .. [python] list에서 중복 원소 제거(duplicate elements) 안녕하세요! 오늘도 갑자기 코드를 쓰다가 궁금해진 내용이 있어 남기고자 글을 적어봅니다. 파이썬에서 리스트 형태의 자료를 자주 사용하는데요, 여러 리스트를 합치거나 하다 보면 리스트에 중복된 원소가 있더라구요. 그동안은 항상 list를 set으로 바꾸어 주었는데, set(집합) 형태의 자료형은 중복 원소를 허용하지 않기 때문에 자동으로 중복된 원소를 제거 해주거든요. 하지만 set 형태의 자료형은 구성 원소의 순서를 유지하기 어렵다는 문제가 있었습니다. 그래서 오늘도 새로운 선생님인 ChatGPT 선생님의 도움을 살짝 받아 보았습니다. 영어 실력이 부끄럽지만 제 질문과 답변은 아래 이미지와 같습니다. 그렇지만 위의 이미지에서 나온 답변은 순서를 유지하는 경우와 유지하지 않는 경우가 따로 기재되 있어 좀 .. PCA(주성분분석) vs LDA(선형판별분석) 비교 안녕하세요! 오늘도 링크드인을 보다 다시 한번 복습하기 좋은 글이 있어서 정리하여 공유드립니다. 작게나마 도움이 되었으면 좋겠습니다! 주성분 분석과 선형 판별 분석은 차원 축소할 때마다 가장 먼저 떠오르는 용어들입니다. 하지만, 각각이 무엇인지 배우고 듣지만 계속 까먹게 되더라구요. 그래서 먼저 요즘 핫한 ChatGPT에 질문해 보았습니다. 내용을 요약하자면, 주성분 분석(Principal Component Analysis) 차원 축소를 위해 데이터 분석과 머신러닝 분야서 쓰이는 기법으로, 비지도 방법(데이터에 클래스 레이블이 주어지지 않은 경우)입니다. PCA는 데이터에서 가장 큰 분산(변동)을 설명하는 주성분(Principal Component)이라고 하는 선형적으로 상관관계가 없는 새로운 변수 세트.. 확률, 밀도, 그리고 분포 (번역문) 안녕하세요. 오늘은 정말정말 오랜만에 웹 검색을 하다가 통계에 관한 글을 읽고 내용을 번역하고, 이해한 내용을 정리하고자 글을 남깁니다. 번역이나 문장이 메끄럽지 않더라도 이해 부탁드립니다. 오늘 소개 드릴 글은 'Tivadar Danka'라는 분이 쓰신 "Probabilities, densities, and distributions - Setting common misconceptions straight" 라는 글입니다. 제목에서 보다시피 이 글은 우리가 확률과 밀도, 그리고 분포에 대해서 우리가 잘못생각하고 있는 오해를 바로 세우고자 작성된 글입니다. 저도 읽으면서 헷갈리던 개념을 다시 바로 잡을 수 있었는데요. 그럼 이제 본격적으로 시작해 볼까요? 출처 : https://thepalindrome.s.. 이전 1 2 3 4 5 6 ··· 9 다음