مدل R1 از DeepSeek ارزونترین مدل استدلالی نیست و o3-mini از OpenAI میتونه باشه. میگم چرا. یه مقایسه با ۳ تا معیار. ۱. دقت (Accuracy). ۲.زمان پاسخدهی (Latency). ۳.هزینه برای تولید پاسخ.
مدل R1 برای هر میلیون توکن ورودی ۰.۷۵ دلار و برای هر میلیون توکن خروجی ۲.۴ دلار هزینه داره. مدل o3-mini برای هر میلیون توکن ورودی ۱.۱۰ دلار و برای هر میلیون توکن خروجی ۴.۴ دلار هزینه داره. یعنی تقریبا دو برابر هزینه توکن بیشتر، با این حال هزینه توکن با هزینه جواب به درخواست فرق داره. اینجا باید تست کرد که هر جواب چقدر هزینه ایجاد میکنه.
از R1 میخوایم که سهامهایی رو نشون بده که سود تقسیمی (dividend) قویای دارن. بازده سود بیش از ۳ درصد، رشد سود در ۵ سال گذشته بالای ۵ درصد و نسبت بدهی به حقوق صاحبان سهام کمتر از ۰.۵ درصد. برای جواب R1 تو دو آزمایش وقتش تموم شد و ارور (timeout) داد، مدل داره از «کل بدهیها» استفاده میکنه نه «بدهی» یا سود سالانه رو چک میکنه در صورتی که سود هر فصل رو باید چک کنه. خروجی میتونه این باشه، دقت صفر. هزینه ۶ سنت و تاخیر ۴۱ دقیقه.
دقیقا همون سوال از o3-mini پرسیده میشه و تونست یه لیست از سهامهایی مثل Conoco، CME Group، EOG Resources، و DiamondBack Energy که رشد سود تقسیمی خیلی بالایی داشتن و با درخواستمون یکی بود رو توی ۲ دقیقه و ۲۴ ثانیه ارائه بده. در مجموع میشه به دقتش ۱ امتیاز، هزینه ۶ سنت و تاخیر ۲ دقیقه و ۲۴ ثانیه حساب کرد.
توی ۲۴ ساعت گذشته از زمانی که o3-mini اومده کلی از کاربرها باهاش کار کردن و اعتقاد دارن بهترین مدل استدلالی موجود هست، البته منهای o3.
austin-starks@geekalerts