Puffy Bird's picture

Puffy Bird

puffy310

·

AI & ML interests

None yet

Organizations

New activity in dalle-mini/dalle-mini about 1 year ago

How to convert this model into safetensors format for use in comfyUI?

#46 opened almost 2 years ago by

New activity in TheBirdLegacy/DallData over 1 year ago

License is missing

#1 opened over 1 year ago by

commented a paper over 1 year ago

YesBut: A High-Quality Annotated Multimodal Dataset for evaluating Satire Comprehension capability of Vision-Language Models

Paper • 2409.13592 • Published Sep 20, 2024 • 50 •

New activity in G-reen/gpt5o-reflexion-q-agi-llama-3.1-8b over 1 year ago

G-reen/gpt5o-reflexion-q-agi-llama-3.1-8b Just SHOCKED The Entire INDUSTRY with 12000 volts

#15 opened over 1 year ago by

New activity in deepseek-ai/DeepSeek-V2.5 over 1 year ago

DeepSeek-Coder-V2.5-Lite

#3 opened over 1 year ago by

New activity in qihoo360/FancyVideo over 1 year ago

Glad to see Qihoo Using HF!

#1 opened over 1 year ago by

commented 6 papers over 1 year ago

Patch-Level Training for Large Language Models

Paper • 2407.12665 • Published Jul 17, 2024 • 17 •

LiteSearch: Efficacious Tree Search for LLM

Paper • 2407.00320 • Published Jun 29, 2024 • 40 •

LiteSearch: Efficacious Tree Search for LLM

Paper • 2407.00320 • Published Jun 29, 2024 • 40 •

LiteSearch: Efficacious Tree Search for LLM

Paper • 2407.00320 • Published Jun 29, 2024 • 40 •

Scaling Laws for Linear Complexity Language Models

Paper • 2406.16690 • Published Jun 24, 2024 • 23 •

Scaling Laws for Linear Complexity Language Models

Paper • 2406.16690 • Published Jun 24, 2024 • 23 •

New activity in hpcai-tech/open-sora over 1 year ago

🚩 Report: Not working

#4 opened over 1 year ago by

uraniumcrystalsmaster

New activity in puffy310/ZeroGPU-DeepSeek-V2-LiteCoder over 1 year ago

Apply for community grant: Academic project (gpu)

#1 opened over 1 year ago by

commented 6 papers over 1 year ago

DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence

Paper • 2406.11931 • Published Jun 17, 2024 • 67 •

Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models

Paper • 2406.11831 • Published Jun 17, 2024 • 22 •

PowerInfer-2: Fast Large Language Model Inference on a Smartphone

Paper • 2406.06282 • Published Jun 10, 2024 • 38 •

Skywork-MoE: A Deep Dive into Training Techniques for Mixture-of-Experts Language Models

Paper • 2406.06563 • Published Jun 3, 2024 • 20 •

Skywork-MoE: A Deep Dive into Training Techniques for Mixture-of-Experts Language Models

Paper • 2406.06563 • Published Jun 3, 2024 • 20 •

Skywork-MoE: A Deep Dive into Training Techniques for Mixture-of-Experts Language Models

Paper • 2406.06563 • Published Jun 3, 2024 • 20 •