Dòng tin

39 nội dung mới nhất

Tất cả#LLM 25#Benchmark 14#Agent 11#Suy luận 10#Thị giác máy tính 6#Open source 6#Công cụ 6#Năng suất 5#Anthropic 4#An toàn AI 3#Hugging Face 2#NVIDIA 1

Mới hôm nay

Simon WillisonGitHub Repo khoảng 2 giờ trước

MỚI

Thống kê lượt tải PyPI của Simon Willison

›Công cụ cá nhân để theo dõi thống kê download các thư viện Python

#PyPI#thống kê#Python+1 dòng tóm tắt85%

swyx (Shawn Wang)Blog Bài đăng khoảng 7 giờ trước

MỚI

Anthropic thu hồi hai model Fable và Mythos vì lo ngại an ninh quốc gia

›Fable và Mythos bị thu hồi với TẤT CẢ khách hàng toàn cầu, không chỉ riêng Mỹ

#thu hồi model#an ninh quốc gia#chính sách AI+3 dòng tóm tắt92%

OpenAIBlog Bài đăng Hôm qua

OpenAI Academy ra mắt khóa học AI thực hành cho người đi làm

›Ba khóa học tập trung vào kỹ năng AI thực tiễn cho dân văn phòng

#đào tạo AI#OpenAI#kỹ năng công việc+2 dòng tóm tắt90%

swyx (Shawn Wang)Blog Bài đăng Hôm qua

Loopcraft: Nghệ thuật xếp chồng vòng lặp — thời đại mới của AI agent

›Andrej Karpathy và nhiều chuyên gia kêu gọi 'thoát khỏi vòng lặp' — để AI tự chạy thay vì chờ người dùng ra lệnh

#agentic loop#tự động hóa#workflow+3 dòng tóm tắt88%

OpenAIBlog Bài đăng Hôm qua

Preply kết hợp AI và gia sư người thật để cá nhân hóa việc học ngôn ngữ

›AI tạo tóm tắt bài học và phản hồi sau mỗi buổi học

#giáo dục#học ngôn ngữ#ứng dụng AI+2 dòng tóm tắt88%

AKarXiv Bài báo 2 ngày trước

EvoArena: Benchmark đánh giá LLM agent trong môi trường thay đổi liên tục

›Hầu hết benchmark hiện tại giả định môi trường tĩnh — EvoArena đánh giá trên môi trường động (terminal, phần mềm, mạng xã hội)

#LLM agent#bộ nhớ động#benchmark+3 dòng tóm tắt93%

AKarXiv Bài báo 2 ngày trước

RA-RFT: Dạy LLM suy luận theo phép loại suy thay vì tìm kiếm ngữ nghĩa

›RAG truyền thống tìm văn bản tương tự về ngữ nghĩa — nhưng với bài toán suy luận, điều này không hiệu quả

#RAG#reinforcement learning#toán học+3 dòng tóm tắt91%

AKarXiv Bài báo 2 ngày trước

Mana: Robot học cầm và dùng dụng cụ có khớp nối linh hoạt

›Thao tác dụng cụ có khớp nối (articulated tools) là thách thức lớn vì cần phối hợp nhiều bậc tự do

#robot#sim-to-real#dexterous manipulation+3 dòng tóm tắt90%

AKarXiv Bài báo 2 ngày trước

SpatialClaw: Khung suy luận không gian 3D/4D dùng code làm giao diện hành động

›Các agent không gian hiện tại bị giới hạn bởi giao diện tool cứng nhắc (chạy một lần hoặc gọi tool có cấu trúc)

#suy luận không gian#VLM#agent+3 dòng tóm tắt88%

AKarXiv Bài báo 2 ngày trước

Positional Encoding bị cắt ngắn trong Graph Neural Network: lý thuyết và thực nghiệm

›PE đầy đủ (spectral và walk-based) tương đương nhau về mặt lý thuyết nhưng tốn O(n³)

#GNN#positional encoding#lý thuyết+3 dòng tóm tắt80%

AKarXiv Bài báo 2 ngày trước

LLM tự động đánh giá khả năng tái lập kết quả nghiên cứu khoa học xã hội

›76 nghiên cứu khoa học xã hội/hành vi được dùng để so sánh LLM vs con người

#tái lập nghiên cứu#khoa học xã hội#LLM+3 dòng tóm tắt92%

AKarXiv Bài báo 2 ngày trước

Influcoder: Chắt lọc điểm ảnh hưởng của dữ liệu huấn luyện vào encoder nhỏ gọn

›Influence function giúp xác định mẫu dữ liệu nào gây hành vi xấu (ví dụ: toxic) sau khi huấn luyện

#data attribution#lọc dữ liệu#influence function+3 dòng tóm tắt82%

AKarXiv Bài báo 2 ngày trước

HyperTool: Gọi nhiều tool trong một lần thay vì từng bước riêng lẻ

›Agent truyền thống gọi tool từng bước, lộ toàn bộ dataflow vào context gây lãng phí

#tool use#MCP#agent+3 dòng tóm tắt90%

AKarXiv Bài báo 2 ngày trước

Chắt lọc on-policy: cập nhật thưa và tập trung, không giống fine-tune thông thường

›Cập nhật OPD nhỏ, thưa theo tọa độ, tập trung ở các lớp FFN

#distillation#on-policy#fine-tune+3 dòng tóm tắt78%

AKarXiv Bài báo 2 ngày trước

Operadic Consistency: phát hiện lỗi suy luận LLM không cần nhãn đúng/sai

›Nếu model trả lời câu hỏi phức hợp trực tiếp ≠ tổng hợp từ các bước con, đó là tín hiệu thất bại

#suy luận#phát hiện lỗi#không cần nhãn+3 dòng tóm tắt85%

AKHF Papers Bài báo 2 ngày trước

ArogyaSutra: Hệ thống đa agent hỗ trợ y tế đa phương thức cho 7 ngôn ngữ Ấn Độ

›Dataset ArogyaBodha: 8 nguồn, 31 hệ cơ quan, 6 modalit hình ảnh, 21 lĩnh vực lâm sàng, 7 ngôn ngữ Ấn Độ + tiếng Anh

#y tế#đa ngôn ngữ#multi-agent+3 dòng tóm tắt88%

AKHF Papers Bài báo 2 ngày trước

Agent giọng nói thông minh biết nhường lời trong hội thoại nhiều người

›Đề xuất ModeratorLM - agent giọng nói biết điều phối lượt nói dựa trên vai trò được giao

#giọng nói#hội thoại#nhường lời+3 dòng tóm tắt88%

AKHF Papers Bài báo 2 ngày trước

Tăng tốc suy luận diffusion bằng kỹ thuật xác minh theo khối

›Áp dụng speculative decoding (vốn dùng cho LLM) vào diffusion model liên tục

#diffusion#tăng tốc#suy luận+3 dòng tóm tắt82%

AKHF Papers Bài báo 2 ngày trước

Nhận dạng người qua phong cách chuyển động cơ thể

›Mô hình xác định danh tính người dựa trên kiểu chuyển động đặc trưng cá nhân

#nhận dạng#sinh trắc học#chuyển động+3 dòng tóm tắt80%

AKHF Papers Bài báo 2 ngày trước

TetherCache: Ổn định sinh video dài bằng bộ nhớ cache thông minh

›Tổ chức cache thành ba vùng: sink, memory, recent để quản lý lịch sử hiệu quả

#video dài#cache#diffusion+3 dòng tóm tắt87%

AKHF Papers Bài báo 2 ngày trước

Dự báo đồng thời nhiều hệ thống tương tác với tốc độ nhanh hơn 70 lần

›Ước lượng trạng thái cân bằng chung trước, rồi dự báo dựa trên độ lệch so với cân bằng

#dự báo#tối ưu hóa#tốc độ+3 dòng tóm tắt83%

AKHF Papers Bài báo 2 ngày trước

Điện toán analog hiện đại cho bài toán phương trình vi phân và ma trận

›Ba primitive tính toán cốt lõi: giải phương trình vi phân, phương trình ma trận, nhân ma trận-vector

#phần cứng#analog#hiệu năng+3 dòng tóm tắt79%

AKHF Papers Bài báo 2 ngày trước

Sự bất bình đẳng nhóm trong dữ liệu tổng hợp AI

›Phân tích khi nào synthetic data generation tạo ra sự bất bình đẳng giữa các nhóm nhân khẩu học

#công bằng#dữ liệu tổng hợp#bias+3 dòng tóm tắt85%

AKHF Papers Bài báo 2 ngày trước

TetherCache: Giữ video dài ổn định khi sinh autoregressive

›Vấn đề cốt lõi: khi model tự điều kiện lên output trước đó, lỗi tích lũy gây ra artifact và mất nhất quán

#video#diffusion#long-context+3 dòng tóm tắt87%

AKHF Papers Bài báo 2 ngày trước

Hệ số scaling trong LoRA quan trọng hơn learning rate

›α và learning rate hoạt động khác nhau: α khuếch đại tín hiệu nhiệm vụ mà không tăng drift ratio

#LoRA#fine-tuning#tối ưu hóa+3 dòng tóm tắt88%

swyx (Shawn Wang)Blog Bài đăng 2 ngày trước

Open Models, Agent Labs vs Model Labs, và những gì AI không thể học được

›Thị trường đã thay đổi: từ bi quan về Open Models (2024) sang chấp nhận rộng rãi (2026)

#Agent Labs#chiến lược AI#cạnh tranh+3 dòng tóm tắt82%

AKHF Papers Bài báo 2 ngày trước

Dùng XGBoost + SHAP để phân tích dự đoán lợi nhuận cổ phiếu A-Share Trung Quốc

›XGBoost đạt AUC 0.547 và lợi nhuận long-short +2.38%/tháng trên dữ liệu out-of-sample

#tài chính#XGBoost#SHAP+3 dòng tóm tắt85%

AKHF Papers Bài báo 2 ngày trước

CLARITree: Thuật toán cây hồi quy tuyến tính từng mảnh gần tối ưu, nhanh hơn

›Cây hồi quy tuyến tính từng mảnh vừa dễ giải thích vừa biểu đạt được, nhưng tìm cây tối ưu rất tốn kém

#ML diễn giải được#cây quyết định#thuật toán+3 dòng tóm tắt83%

OpenAIBlog Bài đăng 2 ngày trước

OpenAI ủng hộ Bộ quy tắc thực hành AI của EU về minh bạch nội dung

›OpenAI tham gia EU Code of Practice on AI content transparency

#EU#minh bạch AI#chính sách+2 dòng tóm tắt90%

Ethan MollickBlog Bài đăng 4 ngày trước

Trải nghiệm thực tế với Claude 5 Fable: bước nhảy vọt thực sự

›Fable có thể làm việc liên tục nhiều giờ trên các spec phức tạp nhiều trang

#Claude Fable#đánh giá thực tế#AGI+3 dòng tóm tắt92%

Sebastian RaschkaBlog Bài đăng 7 ngày trước

Danh sách paper LLM đáng đọc nhất nửa đầu 2026 (tháng 1–5)

›Danh sách có chọn lọc, không toàn diện — dựa trên những gì tác giả thấy liên quan cho công việc của mình

#paper 2026#nghiên cứu LLM#tổng hợp+3 dòng tóm tắt91%

Ethan MollickBlog Bài đăng 9 ngày trước

Kết thúc thời đại 'co-intelligence': AI tự chủ đang thay thế AI hỗ trợ

›Anthropic báo cáo AI viết 80% code nội bộ; mỗi developer ship nhiều hơn 8 lần

#tương lai công việc#AI agent#năng suất+3 dòng tóm tắt93%

Ethan MollickBlog Bài đăng 18 ngày trước

Chọn cách viết như người thật trong thời AI

›Mạng xã hội, báo, thậm chí truyện ngắn đoạt giải ngày càng nhiều nội dung do AI tạo ra

#văn viết AI#kỹ năng người#mạng xã hội+3 dòng tóm tắt88%

Sebastian RaschkaBlog Bài đăng 28 ngày trước

Xu hướng kiến trúc LLM mới: chia sẻ KV cache, mHC và Compressed Attention

›Gemma 4 dùng KV sharing và per-layer embeddings để tiết kiệm bộ nhớ

#kiến trúc LLM#KV cache#context dài+3 dòng tóm tắt92%

Andrej KarpathyGitHub Repo 39 ngày trước

nanochat — ChatGPT cá nhân chi phí chỉ $100

›Dự án thực nghiệm huấn luyện mô hình chat nhỏ chi phí thấp

#nanochat#Karpathy#chi phí thấp+1 dòng tóm tắt70%

Sebastian RaschkaBlog Bài đăng 56 ngày trước

Quy trình đọc hiểu kiến trúc LLM từ code và config thực tế

›Paper ngày càng thiếu chi tiết kỹ thuật, đặc biệt từ các lab lớn

#kiến trúc LLM#workflow#học máy+3 dòng tóm tắt93%

Andrej KarpathyGitHub Repo 63 ngày trước

Blog cá nhân của Andrej Karpathy

›Nguồn bài viết kỹ thuật chuyên sâu từ cựu giám đốc AI của Tesla và OpenAI

#Karpathy#blog#AI80%

Andrej KarpathyGitHub Repo 79 ngày trước

autoresearch — agent AI tự động nghiên cứu huấn luyện mô hình trên GPU đơn

›Agent tự chạy và đánh giá các thử nghiệm huấn luyện LLM nhỏ

#agent nghiên cứu#tự động hóa#GPU đơn+2 dòng tóm tắt82%

Andrej KarpathyGitHub Repo 89 ngày trước

Công cụ trực quan hóa dữ liệu nghề nghiệp từ BLS

›Không phải báo cáo chính thức — là công cụ phát triển để khám phá dữ liệu BLS

#thị trường lao động#trực quan hóa#BLS+2 dòng tóm tắt85%