목록전체 글 (33)
무제
판례 json 데이터가 5만 여개가 넘고, 각 데이터를 하나의 CSV로 처리하여 관리하고 싶었다. 나중에는 db를 활용해야겠지만, 현재는 판례 데이터를 병합하여 하나의 데이터프레임으로 만들어 로컬에서 관리할 것이다. 이를 위해 json을 읽고 데이터프레임으로 빠르게 변환하는 방법인 dask를 사용하였다. import dask.bag as dbimport jsonimport globdirectory_path = "./1.판례"json_files = glob.glob(f"{directory_path}/*.json")bag = db.from_sequence(json_files)def load_json(file_path): with open(file_path, 'r', encoding='utf-8') a..
import sysinput = sys.stdin.readlinen, m = map(int, input().split())def two_count(n): two = 0 while n != 0: n = n // 2 two += n return twodef five_count(n): five = 0 while n != 0: n = n // 5 five += n return fiveprint(min(two_count(n) - two_count(n - m) - two_count(m), five_count(n) - five_count(n - m) - five_count(m))) 이 문제도 못풀었다. 5의 지수만을 생각해서 풀었는데,..
import sysinput = sys.stdin.readlinet = int(input())dp = [[0 for _ in range(3)] for _ in range(100001)]dp[1] = [1, 0, 0]dp[2] = [0, 1, 0]dp[3] = [1, 1, 1]for i in range(4, 100001): dp[i][0] = (dp[i - 1][1] + dp[i - 1][2]) % 1000000009 dp[i][1] = (dp[i - 2][0] + dp[i - 2][2]) % 1000000009 dp[i][2] = (dp[i - 3][0] + dp[i - 3][1]) % 1000000009for _ in range(t): n = int(input()) p..
import sysinput = sys.stdin.readlinet = int(input())array = [0]*11for _ in range(t): n = int(input()) for i in range(1, n+1): if i == 1: array[i] = 1 elif i == 2: array[i] = 2 elif i == 3: array[i] = 4 else : array[i] = array[i-1] + array[i-2] + array[i-3] print(array[n]) DP를 사용한 기본 문제.수가 1씩 증가할때 마다 경우의 수가 얼마나 증..
1. LLM 커리큘럼 https://fastcampus.co.kr/data_online_rag RAG를 활용한 완성도 높은 LLM 서비스 구축 With langchain & llamaindex | 패스트캠퍼스할루시네이션부터 데이터 유출 고민까지 한 번에 해결하세요!fastcampus.co.kr좋은 커리큘럼인 것 같다 2. LLM 파인튜닝 https://velog.io/@gaetokk/LLM-%ED%9B%88%EB%A0%A8-%EC%9A%A9%EC%96%B4%EB%93%A4-%EC%A0%95%EB%A6%AC 3. 프로젝트 참고 https://github.com/hunsii/LawBot?tab=readme-ov-file GitHub - hunsii/LawBot: LLM을 활용한 대화형 유사 판례 검색 시스템..
Allganize에서 제공한 자동화 코드를 사용했고, 3가지의 평가 모델을 사용하여 내가 만든 모델이 GT와 일치성이 높으면 "O", 그렇지 않으면 "X"를 출력하도록 설계 되어있다. 모델은 ChatOpenAI의 효율성 좋은 GPT4-mini를 사용하였고, vector DB는 qdrant를 썼다# modelllm = ChatOpenAI( temperature=0.1, model = "gpt-4o-mini")cache_dir = LocalFileStore("./.cache/")splitter = CharacterTextSplitter.from_tiktoken_encoder( separator="\n", chunk_size=600, chunk_overlap=100,)embeddin..
1. 나의 풀이 통과한 풀이지만 모범답안을 보니 엉망이네import sysinput = sys.stdin.readlinen = int(input())array = [1]*501for i in range(1, n+1): array[i] = array[i-1]*ianswer = 0 while array[n] % 10 == 0: array[n] = array[n] // 10 answer +=1print(answer) 2. 좋은 풀이 와 10은 2x5이므로 5의 개수만 찾아내면 된다....범위가 500까지므로 5의 3제곱수까지만 계산해주면 된다 이걸 어케 생각하는거지...N = int(input())print(N//5 + N//25 + N//125)
import sysinput = sys.stdin.readlinenumber = [True] * 1000001# 소수 listfor i in range(2, int(len(number) ** 0.5) + 1): if number[i]: for j in range(2 * i, 1000001, i): number[j] = Falsewhile 1: n = int(input()) if n == 0: break for i in range(n - 3, 2, -2): if (number[i] == True) and (number[n - i] == True): print(f"{n} = {n-i} + {i}") ..