SW Simon Willison GitHub Repo khoảng 2 giờ trước
MỚIThống kê lượt tải PyPI của Simon Willison › Công cụ cá nhân để theo dõi thống kê download các thư viện Python
SW swyx (Shawn Wang) Blog Bài đăng khoảng 7 giờ trước
MỚIAnthropic thu hồi hai model Fable và Mythos vì lo ngại an ninh quốc gia › Fable và Mythos bị thu hồi với TẤT CẢ khách hàng toàn cầu, không chỉ riêng Mỹ
OP OpenAI Blog Bài đăng Hôm qua
OpenAI Academy ra mắt khóa học AI thực hành cho người đi làm › Ba khóa học tập trung vào kỹ năng AI thực tiễn cho dân văn phòng
SW swyx (Shawn Wang) Blog Bài đăng Hôm qua
Loopcraft: Nghệ thuật xếp chồng vòng lặp — thời đại mới của AI agent › Andrej Karpathy và nhiều chuyên gia kêu gọi 'thoát khỏi vòng lặp' — để AI tự chạy thay vì chờ người dùng ra lệnh
OP OpenAI Blog Bài đăng Hôm qua
Preply kết hợp AI và gia sư người thật để cá nhân hóa việc học ngôn ngữ › AI tạo tóm tắt bài học và phản hồi sau mỗi buổi học
AK AK arXiv Bài báo 2 ngày trước
EvoArena: Benchmark đánh giá LLM agent trong môi trường thay đổi liên tục › Hầu hết benchmark hiện tại giả định môi trường tĩnh — EvoArena đánh giá trên môi trường động (terminal, phần mềm, mạng xã hội)
AK AK arXiv Bài báo 2 ngày trước
RA-RFT: Dạy LLM suy luận theo phép loại suy thay vì tìm kiếm ngữ nghĩa › RAG truyền thống tìm văn bản tương tự về ngữ nghĩa — nhưng với bài toán suy luận, điều này không hiệu quả
AK AK arXiv Bài báo 2 ngày trước
Mana: Robot học cầm và dùng dụng cụ có khớp nối linh hoạt › Thao tác dụng cụ có khớp nối (articulated tools) là thách thức lớn vì cần phối hợp nhiều bậc tự do
AK AK arXiv Bài báo 2 ngày trước
SpatialClaw: Khung suy luận không gian 3D/4D dùng code làm giao diện hành động › Các agent không gian hiện tại bị giới hạn bởi giao diện tool cứng nhắc (chạy một lần hoặc gọi tool có cấu trúc)
AK AK arXiv Bài báo 2 ngày trước
Positional Encoding bị cắt ngắn trong Graph Neural Network: lý thuyết và thực nghiệm › PE đầy đủ (spectral và walk-based) tương đương nhau về mặt lý thuyết nhưng tốn O(n³)
AK AK arXiv Bài báo 2 ngày trước
LLM tự động đánh giá khả năng tái lập kết quả nghiên cứu khoa học xã hội › 76 nghiên cứu khoa học xã hội/hành vi được dùng để so sánh LLM vs con người
AK AK arXiv Bài báo 2 ngày trước
Influcoder: Chắt lọc điểm ảnh hưởng của dữ liệu huấn luyện vào encoder nhỏ gọn › Influence function giúp xác định mẫu dữ liệu nào gây hành vi xấu (ví dụ: toxic) sau khi huấn luyện
AK AK arXiv Bài báo 2 ngày trước
HyperTool: Gọi nhiều tool trong một lần thay vì từng bước riêng lẻ › Agent truyền thống gọi tool từng bước, lộ toàn bộ dataflow vào context gây lãng phí
AK AK arXiv Bài báo 2 ngày trước
Chắt lọc on-policy: cập nhật thưa và tập trung, không giống fine-tune thông thường › Cập nhật OPD nhỏ, thưa theo tọa độ, tập trung ở các lớp FFN
AK AK arXiv Bài báo 2 ngày trước
Operadic Consistency: phát hiện lỗi suy luận LLM không cần nhãn đúng/sai › Nếu model trả lời câu hỏi phức hợp trực tiếp ≠ tổng hợp từ các bước con, đó là tín hiệu thất bại
AK AK HF Papers Bài báo 2 ngày trước
ArogyaSutra: Hệ thống đa agent hỗ trợ y tế đa phương thức cho 7 ngôn ngữ Ấn Độ › Dataset ArogyaBodha: 8 nguồn, 31 hệ cơ quan, 6 modalit hình ảnh, 21 lĩnh vực lâm sàng, 7 ngôn ngữ Ấn Độ + tiếng Anh
AK AK HF Papers Bài báo 2 ngày trước
Agent giọng nói thông minh biết nhường lời trong hội thoại nhiều người › Đề xuất ModeratorLM - agent giọng nói biết điều phối lượt nói dựa trên vai trò được giao
AK AK HF Papers Bài báo 2 ngày trước
Tăng tốc suy luận diffusion bằng kỹ thuật xác minh theo khối › Áp dụng speculative decoding (vốn dùng cho LLM) vào diffusion model liên tục
AK AK HF Papers Bài báo 2 ngày trước
Nhận dạng người qua phong cách chuyển động cơ thể › Mô hình xác định danh tính người dựa trên kiểu chuyển động đặc trưng cá nhân
AK AK HF Papers Bài báo 2 ngày trước
TetherCache: Ổn định sinh video dài bằng bộ nhớ cache thông minh › Tổ chức cache thành ba vùng: sink, memory, recent để quản lý lịch sử hiệu quả
AK AK HF Papers Bài báo 2 ngày trước
Dự báo đồng thời nhiều hệ thống tương tác với tốc độ nhanh hơn 70 lần › Ước lượng trạng thái cân bằng chung trước, rồi dự báo dựa trên độ lệch so với cân bằng
AK AK HF Papers Bài báo 2 ngày trước
Điện toán analog hiện đại cho bài toán phương trình vi phân và ma trận › Ba primitive tính toán cốt lõi: giải phương trình vi phân, phương trình ma trận, nhân ma trận-vector
AK AK HF Papers Bài báo 2 ngày trước
Sự bất bình đẳng nhóm trong dữ liệu tổng hợp AI › Phân tích khi nào synthetic data generation tạo ra sự bất bình đẳng giữa các nhóm nhân khẩu học
AK AK HF Papers Bài báo 2 ngày trước
TetherCache: Giữ video dài ổn định khi sinh autoregressive › Vấn đề cốt lõi: khi model tự điều kiện lên output trước đó, lỗi tích lũy gây ra artifact và mất nhất quán
AK AK HF Papers Bài báo 2 ngày trước
Hệ số scaling trong LoRA quan trọng hơn learning rate › α và learning rate hoạt động khác nhau: α khuếch đại tín hiệu nhiệm vụ mà không tăng drift ratio
SW swyx (Shawn Wang) Blog Bài đăng 2 ngày trước
Open Models, Agent Labs vs Model Labs, và những gì AI không thể học được › Thị trường đã thay đổi: từ bi quan về Open Models (2024) sang chấp nhận rộng rãi (2026)
AK AK HF Papers Bài báo 2 ngày trước
Dùng XGBoost + SHAP để phân tích dự đoán lợi nhuận cổ phiếu A-Share Trung Quốc › XGBoost đạt AUC 0.547 và lợi nhuận long-short +2.38%/tháng trên dữ liệu out-of-sample
AK AK HF Papers Bài báo 2 ngày trước
CLARITree: Thuật toán cây hồi quy tuyến tính từng mảnh gần tối ưu, nhanh hơn › Cây hồi quy tuyến tính từng mảnh vừa dễ giải thích vừa biểu đạt được, nhưng tìm cây tối ưu rất tốn kém
OP OpenAI Blog Bài đăng 2 ngày trước
OpenAI ủng hộ Bộ quy tắc thực hành AI của EU về minh bạch nội dung › OpenAI tham gia EU Code of Practice on AI content transparency
EM Ethan Mollick Blog Bài đăng 4 ngày trước
Trải nghiệm thực tế với Claude 5 Fable: bước nhảy vọt thực sự › Fable có thể làm việc liên tục nhiều giờ trên các spec phức tạp nhiều trang
SR Sebastian Raschka Blog Bài đăng 7 ngày trước
Danh sách paper LLM đáng đọc nhất nửa đầu 2026 (tháng 1–5) › Danh sách có chọn lọc, không toàn diện — dựa trên những gì tác giả thấy liên quan cho công việc của mình
EM Ethan Mollick Blog Bài đăng 9 ngày trước
Kết thúc thời đại 'co-intelligence': AI tự chủ đang thay thế AI hỗ trợ › Anthropic báo cáo AI viết 80% code nội bộ; mỗi developer ship nhiều hơn 8 lần
EM Ethan Mollick Blog Bài đăng 18 ngày trước
Chọn cách viết như người thật trong thời AI › Mạng xã hội, báo, thậm chí truyện ngắn đoạt giải ngày càng nhiều nội dung do AI tạo ra
SR Sebastian Raschka Blog Bài đăng 28 ngày trước
Xu hướng kiến trúc LLM mới: chia sẻ KV cache, mHC và Compressed Attention › Gemma 4 dùng KV sharing và per-layer embeddings để tiết kiệm bộ nhớ
AK Andrej Karpathy GitHub Repo 39 ngày trước
nanochat — ChatGPT cá nhân chi phí chỉ $100 › Dự án thực nghiệm huấn luyện mô hình chat nhỏ chi phí thấp
SR Sebastian Raschka Blog Bài đăng 56 ngày trước
Quy trình đọc hiểu kiến trúc LLM từ code và config thực tế › Paper ngày càng thiếu chi tiết kỹ thuật, đặc biệt từ các lab lớn
AK Andrej Karpathy GitHub Repo 63 ngày trước
Blog cá nhân của Andrej Karpathy › Nguồn bài viết kỹ thuật chuyên sâu từ cựu giám đốc AI của Tesla và OpenAI
AK Andrej Karpathy GitHub Repo 79 ngày trước
autoresearch — agent AI tự động nghiên cứu huấn luyện mô hình trên GPU đơn › Agent tự chạy và đánh giá các thử nghiệm huấn luyện LLM nhỏ
AK Andrej Karpathy GitHub Repo 89 ngày trước
Công cụ trực quan hóa dữ liệu nghề nghiệp từ BLS › Không phải báo cáo chính thức — là công cụ phát triển để khám phá dữ liệu BLS