پیش ثبت‌نام دوره NGS بالینی آغاز شد …

معرفی زبان برنامه نویسی R

R یک مجموعه ی یکپارچه از امکانات نرم افزاری برای دستکاری داده، محاسبات آماری و نمایش گرافیکی است که محبوبیت آن در بین آماریست ها، آنالیزور های دیتا، محققین و بازاریابان در حال افزایش می باشد. از نقاط قوتR ، آسانی استفاده از آن است و اینکه می‌توان با آن پلات هایی با کیفیت انتشار خوب طراحی کرد!
زبان برنامه نویسی R

فهرست مطالب این نوشتار

تاریخچه

داستان شکل گیری ایده ی طراحی R، در سال 1990 با ملاقات اتفاقی Ross Ihaka  (که به تازگی به گروه آمار دانشگاه اوکلند پیوسته بود) و Robert Gentleman (که در حال گذراندن تعطیلاتش از دانشگاه واترلو بود) کلید خورد. حاصل این دیدار، جرقه خوردن نوشتن یک نرم افزار با هدف ایجاد یک بستر آزمایشی برای تست ایده ها، و انتشار یک یا دو مقاله بود! درسال 1992، تصمیم گرفته شد که از زبان برنامه نویسی S برای نوشتن R استفاده شود و به طنز، به خاطر Robert و Ross، نام “R” برای این زبان درنظر گرفته شد. در سال 1994، ورژن اولیه ی R کامل شد اما همچنان تا دو سال بعد، Robert و Ross کلی گزارش از باگ های R و بسیاری هم پیشنهاد برای بهبود این زبان دریافت می کردند. در نهایت در سال 1997، با افزایش تعداد کاربران R، بانیان اصلی این زبان، به موفقیت پیش بینی شده ی خود رسیدند!

مزیت های R

R ابزاری با هدف تجزیه و تحلیل داده ها می باشد که جهت آنالیز آماری، تجسم داده های بیولوژیکی و ایجاد مدل های داده استفاده می شود. از جمله ویژگی های بارز این ابزار، میتوان به موارد زیر اشاره کرد:

R متن باز (open source) است.

به این معنی که به صورت رایگان در اختیار کابران قرار میگیرد و همچنین کاربر میتواند از کد منبع استفاده کرده و آن را تغییر دهد. به علاوه، R به شکلی فعال توسط یک مجموعه در حال توسعه است ( r-project.org را ببینید)، و به روز رسانی های منظمی برایش وجود دارد.

R قدرتمند است.

  • R بر روی چندین پلتفرم
    قابل اجرا است (Windows/MacOS/Linux). R می تواند با دیتاست های بسیار بزرگتر از
    برنامه های spreadsheet محبوب مانند Microsoft
    Excel کار کند و به دلیل
    قابلیت های اسکریپت نویسی آن بسیار قابل بازیابی (reproducible) است.
  • با R
    طیف وسیعی از تکنیک‌های آماری (مدل‌سازی خطی و غیرخطی،
    آزمون‌های آماری کلاسیک، تجزیه و تحلیل سری‌های زمانی، طبقه‌بندی، خوشه‌بندی،
    …) و گرافیکی، قابل اجرا خواهند بود.                                         
    “تصویر برخی از نمودارهای رسم شده با R را در ادامه می بینیم.”
  • R بر روی انواع مختلف دیتا (vector، array، matrix و …) با سایزهای مختلف، عملیات انجام میدهد.
  • هزاران بسته (package) نرم افزاری در حیطه ی علوم، از جمله ژنومیک و سایر حوزه های علوم
    زیستی برای R
    وجود دارد.

CRAN
(https://cran.r-project.org) منبع (repository) اصلی برای پکیج های R است و نسخه های یکسان و
به روز از کد و اسناد را برای R ذخیره می کند.

Bioconductor
(https://www.bioconductor.org) پروژه ای است که دارای کدهای بر مبنای R برای آنالیز داده های
ژنومیک می باشد.

  • R میتواند با استفاده از
    پکیج هایی همچون  ddR یا multiDplyr، محاسبات موازی یا توزیع
    شده را پردازش کند.

     

    • R به کامپایلر (برنامه‌ای
      که کد نوشته شده از زبان مبدا را به زبان مقصد ترجمه می‌کند) نیاز ندارد. R یک زبان تفسیر شده است و
      کد ارائه شده را به کدهای از پیش کامپایل شده تفسیر می کند.

  • R با زبان های دیگر مانند C، C++، و FORTRAN سازگار است و با زبان هایی مانند دات نت، جاوا، و پایتون نیز می توان مستقیماً کدها را دستکاری کرد.
  • R میتواند برای یادگیری ماشین نیز مفید باشد. فیس‌بوک بسیاری از تحقیقات یادگیری ماشین خود را با R انجام می‌دهد.
  • R شامل چندین پکیج است که آن را قادر می سازد با پایگاه های داده تعامل داشته باشد، مانند: Roracle، ، RmySQL  و … .

R ابزاری با کاربرد گستره است.

از آنجا که R نه تنها در زمینه ی بیوانفورماتیک، بلکه در بسیاری از رشته ها استفاده میشود، پس به احتمال زیاد، تقریباً هر پیام خطایی که با آن مواجه می شوید، شخص دیگری قبلاً آن را تجربه کرده است. بنابراین میتوانید روی کمک های آنلاین حساب کنید!

پیشنهاد: برای آشنایی با اهداف طراحی دارو در روشن‌سازی پوست، مقاله طراحی دارو در روشن سازی پوست را مطالعه کنید.

معایب R

  • مدیریت حافظه R ضعیف است.
    • دستورات R به مدیریت حافظه مربوط نمی شوند. در نتیجه R  می تواند تمام فضای موجود را اشغال کند.
  • سرعت R آهسته است.
    • برنامه ها و توابع در R در پکیج های مختلف پخش شده اند. این باعث می شود که سرعت R نسبت به زبان هایی مانندMATLAB  و Python کندتر باشد.
  • امنیت R ضعیف است.
    • R فاقد
      اقدامات اولیه امنیتی است. بنابراین ساختن برنامه های وب با آن
      همیشه ایمن نیست.
  • الگوریتم های R در پکیج های مختلف پراکنده هستند.
    • برنامه نویسان بدون دانش قبلی از پکیج ها ممکن است برای پیاده سازی
      الگوریتم ها دچار مشکل شوند.

RStudio

RStudio یک محیط توسعه یکپارچه (IDE) برای R است که شامل کنسول، ویرایشگر هایلایت کننده ی سینتکس که اجرای مستقیم
کد را پشتیبانی میکند، و همچنین ابزارهایی برای ترسیم (plotting)، تاریخچه (history)، اشکال زدایی (debugging) و مدیریت فضای کاری می
باشد.

پیشنهاد: به‌منظور ثبت سفارش برای خدمات آنالیز‌های آماری به صفحه خدمات آنالیز‌های آماری مراجعه فرمایید.  آنالیز‌های آماری در میزکار وانیار و زیرنظر کارشناسان بیوانفورماتیک صورت می‌گیرد.

RStudio در نسخه های منبع باز و
تجاری موجود است و روی دسکتاپ (Windows/MacOS/Linux) و یا در مرورگر متصل به server
RStudio
یا RStudio Workbench
(Debian/Ubuntu,
Red Hat/CentOS, and SUSE Linux)، قابل اجرا می باشد.

درRStudio  این امکان وجود دارد که بدون استفاده از دستور
خاصی، نمودارهای رسم شده را به صورت فایل pdf یا عکس ذخیره نمود. امکان نصب و
یا به روز رسانی کتابخانه های کاربردی مختلف نیز در قسمت Package فراهم شده است.

به منظور چشیدن شیرینی زبان R، به کار بردن RStudio توصیه میشود! ????

منابع:

https://www.r-project.org/about.html

پروفایل گروه بیوانفورماتیک وانیار
تیم تولید محتوای وانیار:

تیم تولید محتوای گروه بیوانفورماتیک وانیار در تلاش است تا بهترین آموزش‌های کوتاه در زمینه بیوانفورماتیک و زیست‌شناسی را تهیه نماید. صحت محتوای این صفحه توسط کارشناسان گروه بیوانفورماتیک وانیار بررسی شده است.

جدیدترین آموزک‌های بیوانفورماتیک

عضویت در مجله وانیار

جدید ترین مقالات در ایمیل شما!

با عضویت در مجله بیوانفورماتیک وانیار ، برترین مقالات را در ایمیل خود دریافت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

هر گونه سوالی دارید، تیم ما آماده پاسخگویی می‌باشد.

برای برقراری ارتباط بر روی آیکن مورد نظر کلیک کنید. پشتیبانی 24/7