در این اثر علمی تقریباً همۀ حوزههای مطرح و در دست پژوهش رایج راجع به تجریۀ دادههای حاصل از توالییابی نسل جدید درباره مطالعۀ ژنوم و ترنسکریپتوم پوشش داده شود و برای درک بهتر علاوه بر تأکید روی مبانی آنها به ذکر شیوۀ اجرای درست و دقیق پروژهها با ذکر دستورات کاربردی سلسلهوار و استفاده از منابع تصویری متعدد برای قابل فهمتر کردن موضوع یا تجزیۀ در دست بحث استفاده شود. بهطور کلی در این اثر علمی بیش از ۱۱۲۰ دستور کاربردی مهم (شامل بیش از ۸۵۰ دستور قابل اجراء در محیط پایتون و Perl و ۲۷۰ دستور در محیط R) به همراه توضیح دقیقی راجعبه چرایی استفاده از آنها و گزینههای لازم و مناسب برای تجزیههای منظور، ۳۸۳ تصویر با کیفیّت مناسب برای درک بهتر مطالب و تجزیهها و ۸۶ جدول مفید در راستای کمک به مقایسههای مختلف یا توضیح نتایج تجزیهها آمده است. با این اوصاف کتاب پیش رو بدون اقراق تنها کتاب جامع درباره تجزیهوتحلیل دادههای NGS به زبان فارسی است که با زبانی ساده، روان و پروژهمحورانه نگاشته شده است. محتوی و روشهای بیانشده در فصلهای مختلف آن مناسب پژوهشگران عرصههای مختلف زیستی مانند زیستشناسی، کشاورزی و پزشکی است و نیز میتواند بهعنوان منبع درسی برای دورههای کارشناسی ارشد و دکتری در رشتههای مختلف؛ زیستشناسی مولکولی، بیوتکنولوژی کشاورزی و پزشکی، ژنتیک گیاهی و دامی و میکروبیولوژی صنعتی، کشاورزی و پزشکی استفاده شود.
پیشگفتار مؤلف ۳۵
فصل اول: روشهای مختلف توالی یابی نسل دوم و کاربردهای آنها ۴۱
مقدمه ۴۱
تعیین توالی به وسیلۀ واکنش زنجیرهای پلیمراز ۴۲
فنّاوریهای توالی یابی Ilumina ۴۸
فراخوانی بازها در روش توالی یابی Illumina ۵۳
فنّاوری توالی یابی نانوحلقۀ DNA ۵۴
مراحل اجرا ۵۶
آماده سازی نمونه ۵۶
ساخت DNB ۵۶
بارگذاری DNB ۵۷
فنّاوری cPAS ۵۸
معرف توالی یابی CoolmpStm ۵۸
آماده سازی رشتۀ دوم ۵۹
فنّاوری توالی یابی جریان یونی (Ion Torrent) ۵۹
آمادهسازی نمونه و توالی یابی در سکوی جریان یونی ۶۰
تراشههای نیمه هادی و توالی یابی غیر اپتیکی ۶۱
فراخوانی بازها ۶۳
بررسی و تحلیل ترنسکریپتوم ۶۳
توالییابی و سرهم کردن ترنسکریپتوم ۶۴
توالی یابی RNA ۶۴
روشهای مختلف توالی یابی RNA ۶۵
توالی یابی RNA کل ۶۵
توالییابی RNA هدف ۶۵
توالییابی RNA تکسلول (scRNA-seq) ۶۶
توالی یابی Small RNA ۶۷
توالی یابی مختص رشته ۶۸
نمایه ریبوزوم (Ribo-Seq) ۷۰
توالی یابی mRNA (mRNA-seq) ۷۳
فصل دوم: مبانی کنترل کیفیّت و کیفی سنجی نتایج توالی یابی ۷۵
مقدمه ۷۵
قالب FASTQ و مبانی کنترل کیفیّت بازها و خوانشها ۷۵
اجرای برنامۀ fastp در محیط پایتون ۷۹
اجرای برنامۀ Rfastp در محیط R ۸۲
فصل سوم: الگوریتمهای سرهم کردن خوانشها ۸۵
مقدمه ۸۵
الگوریتمهای سرهمکردن: OLC و DBG ۸۵
تعریف عمومی از گراف دیبروین ۸۷
ضرورت استفاده از گراف دیبروین برای سرهمکردن خوانشهای ژنوم ۸۸
ماهیت دورشتهای ژنوم ۹۱
تأثیر موتاسیون در اندازۀ K-mer ۹۱
گراف دیبروین برای نواحی تکراری ۹۳
چند نکته مهم درباره گراف de Bruijn ۹۴
روش سرهمکردن ژنوم با استفاده از گراف دیبروین ۹۵
سرهم کردن ژنوم از طریق خوانشهای کامل و صحیح ۹۵
گراف دیبروین و روش توالی یابی سنگر ۹۷
تفاوت در اندازۀ K-mer برای جبران کمبودها ۹۸
چرا کانتیگهای سرهم شده کوتاهتر از طول خوانشها هستند؟ ۱۰۰
حافظه (RAM) لازم و توزیع K-mer در یک کتابخانه ۱۰۰
سرهم کردن ژنوم با خوانشهای نادرست. تأثیرات و اقدامات ۱۰۱
چرا نرمافزارهای مبتنی بر گراف دیبروین به میزان بالایی حافظه احتیاج دارند؟ ۱۰۱
تأثیر خطاهای توالییابی در ساختار گراف دیبروین ۱۰۵
انشعابات، حبابها و اتصالات کاذب ۱۰۶
شاخهها و حبابها: خطا در توالییابی یا پلیمورفیسم؟! ۱۰۹
تأثیر توالییابیهای ناهمشکل ۱۰۹
ترسیم گراف دیبروین از یک توالی کوتاه ۱۱۰
گراف دیبروین برای دادههای ترنسکریپتوم یا کتابخانۀ RNA-Seq ۱۱۱
گراف دیبروین برای ژنهایی با پیرایش متناوب ۱۱۳
گراف دیبروین برای ژنومهایی با میزان پلیمورفیسم بالا ۱۱۴
گراف دیبروین برای خوانشهایی با طول بلند ۱۱۵
گراف دیبروین برای مطالعات متاژنومیکس ۱۱۶
فصل چهارم: توصیف قالبهای پرکاربرد دادهها و ساخت آنها ۱۱۹
مقدمه ۱۱۹
قالب GFF ۱۱۹
ایجاد فایل GFF۳ ۱۲۰
اجرای برنامۀ Gmap ۱۲۰
مراحل اجرای برنامۀ Gmap ۱۲۲
اجرای برنامۀ spaln ۱۲۳
فیلتر و مرتّب کردن نتایج همردیفی بین ژنها و ژنوم ۱۲۵
همردیفی محلّی و نیمهکلی ۱۲۶
بهره برداری از فایل GFF۳ با استفاده از برنامۀ BEDTools ۱۲۶
استخراج ویژگیهای ژنومی با استفاده از ابزار GAD ۱۲۷
قالب BED ۱۳۱
قالب BedGraph ۱۳۲
مراحل ساخت فایل Bedgraph ۱۳۳
اجرای برنامۀ SAMtools ۱۳۷
حذف خوانشهای همردیف شده در چند مکان ژنوم ۱۳۸
نشانگذاری و حذف خوانشهای که در دو مکان همردیف شده اند ۱۳۹
قالب BAM ۱۳۹
قالب VCF ۱۴۰
قالب Sequence Read Archive (SRA) ۱۴۳
دانلود داده از پایگاه SRA ۱۴۴
قالب FASTQ ۱۴۶
دستکاری و استخراج اطلاعات از فایلهای fa و fq با استفاده از برنامۀ SeqKit ۱۴۷
ارائه شاخصهای آماری یک فایل fa (stats) ۱۴۸
تبدیل فایل fq به fa (fq۲fa) ۱۴۸
تبدیل FASTA/Q در قالب جدول و ارائه اطلاعات لازم (fx۲tab) ۱۴۸
حذف توالیهای تکراری دارای ID/name/sequence یکسان (rmdup) ۱۴۹
شناسایی توالیهای مشترک بین چند فایل (common) ۱۵۰
تقسیم یک فایل بزرگ به فایلهای کوچکتر (split۲) ۱۵۱
تبدیل یک فایل دارای چندتوالی در قالب FASTA به فایلهای مجزا ۱۵۳
مرتّبسازی توالیهای یک فایل براساس شاخصههای مختلف (sort) ۱۵۳
فصل پنجم: همردیفی، مبانی و ابزارها ۱۵۵
مقدمه ۱۵۵
اهداف عملکردی و تکاملی همردیفی ژنها ۱۵۶
درج ۱۵۶
حذف ۱۵۷
جانشینی ۱۵۷
واژگان استفادهشده در همردیفی ۱۵۷
انواع همردیفی ۱۵۷
از نظر همردیفی ۱۵۸
الف- همردیفی کلی ۱۵۸
ب) همردیفی موضعی ۱۵۸
از نظر تعداد توالی همردیفیشده ۱۵۹
الف- همردیفی جفتی ۱۵۹
ب- همردیفی چندگانه ۱۵۹
همردیفی مبتنی بر ماتریس امتیازدهی ۱۵۹
اصول امتیازدهی در همردیفی جفتی توالیها ۱۵۹
مدلهای و ابزارهای استفادهشده در همردیفی پروتئینها ۱۶۳
الف- حفظ شدن ۱۶۴
ب- فراوانی ۱۶۴
ج- تکامل ۱۶۴
شناسایی طول کامل کانتیگها با استفاده از دادههای ترنسکریپتوم یک یا چند پروژه ۱۷۲
اجرای برنامۀ BLAST ۱۷۳
شناسایی عملکرد کانتیگها ۱۷۷
اجرای پروژۀ شناسایی توالیهای تقاضای منحصر به یک گونه ۱۷۷
فصل ششم: راهبردهای سرهمکردن ترنسکریپتوم و ابزارهای آنها ۱۸۱
مقدمه ۱۸۱
راهبرد برپایه ژنوم مرجع (رفرنس) ۱۸۱
راهبرد سرهمکردن de novo ۱۸۴
مرور اجمالی سرهمکردن ترنسکریپتوم براساس ژنوم مرجع ۱۸۴
دستآوردها و مزایای روش de novo ۱۸۴
سرهم کردن de novo در عمل ۱۸۵
معایب و مشکلات سرهم کردن de novo ۱۸۶
سرهم کردن ترنسکریپتوم به صورت ترکیبی با ژنوم مرجع ۱۸۸
برنامۀ Trinity ۱۹۲
خروجی Trinity ۱۹۸
سرهم کردن de novo با استفاده از برنامۀ Trinity ۱۹۹
سرهمکردن خوانشهای دوطرفه ۱۹۹
سرهم کردن خوانشهای یکطرفه ۲۰۰
سرهمکردن خوانشهای هیبرید ۲۰۰
سرهمکردن خوانشهای همردیفشده روی ژنوم ۲۰۲
سرهمکردن خوانشهای حاصل از روش توالییابی ویژه رشته ۲۰۲
مثال نتایج سرهمکردن توالییابی ترنسکریپتوم گیاه گلپر با نرمافزار Trinity ۲۰۳
شناسایی نواحی رمزکننده در توالیهای سرهم شده ۲۰۷
شناسایی بلندترین ORF ۲۰۷
شناسایی ORFها براساس فایل GTF ژنوم ۲۰۸
فایلهای نتایج ۲۰۹
سرهم کردن با استفاده از ژنوم مرجع ۲۱۰
نمایه سازی؛ الگوریتمهای همردیفی توالیها در NGS ۲۱۰
همردیفی توالیها با استفاده از جدول hash ۲۱۰
همردیفی توالیها با استفاده از روش درخت پسوند ۲۱۴
جستجوی توالی در ژنوم مرجع با استفاده از الگوریتم BWT ۲۱۶
ابزارهای سرهمکردن با استفاده از ژنوم مرجع (رفرنس) ۲۱۷
اجرای برنامۀ STAR ۲۱۷
خوشه بندی، دوخت و امتیازدهی ۲۱۹
ساخت فایل ایندکس ژنوم مرجع ۲۲۰
اجرای همردیفی خوانشها با ژنوم مرجع ۲۲۲
اجرای برنامۀ HISAT۲ ۲۲۴
ساخت فایل ایندکس ژنوم ۲۲۴
همردیفی خوانشها روی ژنوم ۲۲۵
اجرای برنامۀ subread در دو محیط پایتون و R ۲۲۶
شناسایی اتصالات اگزون-اگزون ۲۲۹
اجرای برنامۀ subread در محیط R ۲۲۹
همردیفی توالی خوانشهای کنترل کیفیّت شده روی ژنوم ۲۳۰
اجرای برنامۀ subread در محیط پایتون ۲۳۱
همردیفی خوانشهای DNA روی ژنوم در محیط R ۲۳۱
شناسایی SNPها با استفاده از برنامۀ exactSNPاز بستۀ subread در محیط R ۲۳۲
شناسایی SNPها در محیط پایتون ۲۳۲
اجرای همردیفی ژنوم با استفاده از برنامۀ subjunc در محیط R ۲۳۲
اجرای همردیفی ژنوم با استفاده از برنامۀ subjunc در محیط پایتون ۲۳۳
همردیفی خوانشهای بلند روی ژنوم با استفاده از برنامی sublong در محیط R ۲۳۳
همردیفی خوانشهای بلند روی ژنوم با استفاده از برنامۀ sublong در محیط پایتون ۲۳۴
همردیفی microRNAs روی ژنوم ۲۳۴
فصل هفتم: بررسی بیان افتراقی ژنها ۲۳۷
مقدمه ۲۳۷
کمّیسنجی نتایج همردیفی خوانشها روی ژنوم مرجع ۲۳۸
اجرای برنامۀ cufflinks ۲۳۸
اجرای برنامۀ StringTie۲ ۲۳۹
کمّیسنجی با استفاده از ماژول featureCounts بستۀ subread در محیط R ۲۴۰
کمّیسنجی مکان-ژنومی با استفاده از فایلGTF ۲۴۰
کمّیسنجی در محیط پایتون ۲۴۰
کمّیسنجی نتایج همردیفی خوانشها روی توالیهای مرجع ترنسکریپتوم ۲۴۳
اجرای برنامۀ BOWTIE۲ ۲۴۳
ساخت فایل ایندکس مرجع ترنسکریپتوم ۲۴۴
همردیفی خوانشها ۲۴۴
اجرای برنامه های bowtie و bowtie۲ در محیط R ۲۴۶
اجرای برنامۀ bowtie۲ ۲۴۷
اجرای برنامۀ bowtie ۲۴۷
کمّی سنجی ژنها با استفاده از برنامۀ salmon ۲۴۸
نرمال سازی دادههای بیانی ۲۴۸
نرمال سازی دروننمونهای ۲۴۹
مثال محاسبات RPKM ۲۵۱
مثال محاسبات TPM ۲۵۲
روشهای نرمال سازی بین نمونهای ۲۵۳
نرمال سازی براساس چندک بالایی ۲۵۵
روش نرمال سازی TMM ۲۵۶
روش نرمال سازی RLE ۲۵۸
مراحل روش نرمال سازی RLE ۲۵۸
انجام محاسبات روش نرمال سازی TMM ۲۵۹
محاسبۀ آمارۀ M-value ۲۶۱
محاسبۀ آمارۀ A ۲۶۲
محاسبۀ چندک سیام یا دهک سوم M-valueها ۲۶۴
انجام محاسبات روش نرمال سازی RLE ۲۶۶
محاسبۀ TPM و RPKM در محیط R ۲۷۰
حذف آثار ناخواستۀ دسته ای ۲۷۱
اجرای بستۀ sva ۲۷۳
فراخوان بستۀ sva و دادههای بیانی بهمنظور حذف آثار دسته ای ۲۷۳
نمایش داده در فضای دو بعدی با استفاده از برنامۀ Rtsne ۲۷۴
مراحل کار در الگوریتم t-SNE ۲۷۵
اجرای برنامۀ Rtsne ۲۷۹
اجرای برنامۀ ComBat_seq در بستۀ SVA ۲۸۰
تجزیه بیان افتراقی ژنها ۲۸۲
مدلهای آماری تجزیه داده های بیان ژنها ۲۸۳
مدلسازی داده های کانت ۲۸۴
ترسیم نمودار پراکنش میانگین داده ها در مقابل واریانس آنها ۲۸۵
اجرای برنامه های edgeR و DESeq۲ ۲۸۷
اجرای بستۀ edgeR ۲۸۹
محاسبۀ مقادیر تعدیلشدۀ p-value ۲۹۳
بررسی بیان افتراقی ژنها ۲۹۶
اجرای برنامۀ DESEq۲ ۲۹۹
تجزیه بیان افتراقی ژنها ۳۰۳
ترسیم نمودار بیان افتراقی ژنها ۳۰۳
تبدیل داده ها برای نمایش پراکنش آنها ۳۰۷
روش تثبیت واریانس ۳۰۷
روشrlog ۳۰۹
روش لگاریتمی log(x+۱) ۳۰۹
تجزیه افتراقی بیان ژنها با استفاده از رویکرد ناپارامتریک ۳۱۱
بستۀ NOISeq ۳۱۱
برنامۀ NOISeq-real با استفاده از تکرار ۳۱۳
برنامۀ NOISeq-si بدون تکرار ۳۱۳
برنامۀ NOISeqBIO ۳۱۴
اجرای بستۀ NOISeq ۳۱۶
نرمالسازی دادههای بیانی ۳۱۹
فیلتر دادهها ۳۱۹
اجرای برنامۀ noiseq برای تجزیه دادههای بیان بدون تکرار ۳۲۴
استخراج نتایج برنامۀ noiseqbio ۳۲۵
استخراج و ذخیرۀ نتایج ۳۲۵
فصل هشتم: شناسایی پیرایشهای متناوب و circRNAها ۳۲۷
مقدمه ۳۲۷
انواع پیرایش متناوب ۳۲۸
اجرای برنامۀ rMATS ۳۲۸
RNAهای حلقوی ۳۳۴
بیوژنز circRNAها ۳۳۵
خصوصیات circRNAها ۳۳۷
عملکردهای بیولوژیک circRNAها ۳۳۸
circRNAها در پاسخ به تنشهای زیستی و غیر زیستی در گیاهان ۳۴۲
کشف و بررسی نمایه بیان circRNAها ۳۴۳
تنوع circRNA ۳۴۴
نمایه سراسر ژنومی circRNAها ۳۴۵
ساخت کتابخانۀ ترنسکریپتوم حاوی circRNA ۳۴۵
پایگاه های دادۀ circRNA ۳۴۷
الگوریتم های محاسباتی برای شناسایی circRNAها ۳۴۹
شناسایی نواحی پردازش برگشتی ۳۴۹
شناسایی circRNAها با استفاده از برنامۀ CIRI۲ ۳۵۳
تشخیص BSJ با استفاده از روش آماری حداکثر درستنمایی (MLE) ۳۵۴
اجرای برنامۀ CIRI۲ ۳۵۴
ماژول RO۱ ۳۵۵
اجرای ماژول RO۱ ۳۵۶
ماژول RO۲ ۳۵۶
ماژول Merge ۳۵۷
شناسایی circRNAها با استفاده از برنامۀ CIRCexplorer۲ ۳۶۱
اجرای برنامۀ CIRCexplorer۲ ۳۶۱
شناسایی پردازشهای برگشتی متناوب ۳۶۸
شناسایی رویدادهای پردازش متناوب درون circRNAها ۳۶۹
کمّی سنجی و بررسی بیان افتراقی circRNAها با استفاده از ابزار CIRIquant ۳۷۰
اجرای برنامۀ CIRIquant ۳۷۱
محاسبۀ DE و DS ۳۷۴
مراحل انجام بررسی بیان افتراقی ژنها با وجود تکرارهای بیولوژیک ۳۷۵
گام اول: تهیه فایلهای ورودی لازم برای بررسی بیان ۳۷۵
گام دوم: تهیه فایل داده های بیان ژنهای حاصل از برنامۀ StringTie۲ ۳۷۶
کمّیسنجی و بررسی بیان circRNAها به صورت گام به گام و دستی ۳۷۹
مراحل انجام کار بهصورت گامبهگام ۳۸۰
تأئید و تفسیر نتایج شناسایی و بررسی بیان افتراقی circRNAها ۳۸۴
فصل نهم: شناسایی و بررسی بیان میکروRNAها ۳۸۷
مقدمه ۳۸۷
جایگاه ژنومی میکروRNAها و نقش آنها ۳۸۸
شناسایی میکروRNA با استفاده از روشهای محاسباتی ۳۹۰
توالییابی نسل جدید روشی مناسب و جامع برای شناسایی و کمّی سنجی میکروRNA ۳۹۳
نامگذاری میکروRNA ۳۹۴
اجرای برنامۀ miRDeep۲ به منظور شناسایی میکروRNAها ۳۹۵
کمّیسنجی میکروRNAهای بالغ ۴۰۰
اجرای برنامۀ quantifier.pl ۴۰۱
شناسایی میکروRNAهای جدید ۴۰۲
فصل دهم: ترسیم شبکه های هم بیان ۴۰۵
مقدمه ۴۰۵
انواع شبکه های بیولوژیک ۴۰۶
مراحل ساخت شبکۀ همبیان ۴۰۹
پیشپردازش دادهها ۴۰۹
ساخت شبکۀ هم بیان وزندار ۴۱۰
روش گامبهگام ۴۱۰
شناسایی ماژول ۴۱۸
محاسبۀ ماتریس TOM ۴۱۸
ترسیم دندروگرام براساس مقادیر عدم تشابه TOM ۴۲۰
خوشه بندی و روشهای آن ۴۲۰
شناسایی ماژول با تخصیص ژنها به آنها ۴۲۳
تلفیق ماژول های بسیار مشابه ۴۲۴
تجزیه مقادیر منفرد ۴۲۵
مراحل انجام تجزیه به مؤلفه های اصلی (PCA) و محاسبۀ بردارهای ویژه و مقادیر ویژه ۴۲۸
مقادیر ویژه ماتریس ۴۳۱
محاسبۀ مقادیر مؤلفۀ اصلی برای ژنها ۴۳۲
ارتباط بین ماژولها و صفات ۴۳۴
ساخت شبکه به صورت اتوماتیک با استفاده از عملگر بلوک ۴۳۴
انتخاب ژن و ماژول ۴۳۴
مطالعۀ ویژگیهای توپولوژیک شبکه ۴۳۵
تمرکز شبکه ۴۴۰
قابلیت تصویرسازی ۴۴۱
مرتبط سازی با سایر نرمافزارها ۴۴۱
اجرای بستۀ WGCNA برای ترسیم شبکه های همبیان ۴۴۲
تعیین رنگ برای هریک از ماژولها ۴۵۲
تلفیق ماژولها ۴۵۵
استخراج نتایج در قالب برنامۀ cytoscape ۴۵۸
تصویرسازی نتایج با استفاده از برنامۀ WGCNA ۴۵۹
شناسایی بلوک ماژولی برای شبکه های بزرگ ۴۶۲
ترسیم و تجزیۀ ماژولها در برنامۀ Cytoscape ۴۶۳
تصویرسازی شبکۀ ترسیم شده با استفاده از بستۀ WGCNA ۴۶۴
تجزیه شبکه ۴۶۶
۱- روشهای محلّی ۴۶۷
۲- روشهای کلی ۴۶۸
تعیین عملکرد ژنهای درون ماژولهای مرتبط با متابولیت ثانویه زعفران ۴۷۱
شناسایی و تصویرسازی ماژولها ۴۷۲
شناسایی ماژولهای اختصاصی و حفظشده ۴۷۳
آمارههای حفظشدگی ماژول برای شبکه های عمومی ۴۷۴
آمارههای حفظشدگی ماژول برای شبکه های همبستگی ۴۷۶
آمارۀ Zsummary حفظ شدگی ماژول مرکب ۴۷۸
ارزیابی معنیداری آماره های حفظ شدگی ماژول با استفاده از آزمون جایگشت ۴۸۰
شناسایی ماژولهای حفظ شده با استفاده از تابع modulePreservation در بستۀ WGCNA ۴۸۲
اجرای برنامۀ modulePreservation در بستۀ WGCNA ۴۸۵
شناسایی ماژولهای حفظ شده با استفاده از رویکرد جایگشت مقیاس پذیر ۴۹۱
آمارههای حفظشدگی ماژولها ۴۹۴
داده های پراکنده ۴۹۸
آزمون فرض ۴۹۹
برآورد p-value بهوسیلۀ آزمون جایگشت ۵۰۰
مراحل انجام کار در برنامۀ NetRep ۵۰۴
اجرای برنامۀ NetRep در محیط R ۵۰۶
ساخت ماتریس همبستگی داده های بیانی نمونه های گلدار ۵۰۶
ساخت ماتریس همبستگی داده های بیانی نمونه های بدونگل ۵۰۸
بررسی نتایج ۵۱۱
محاسبۀ خصوصیات ماژول در یک شبکه ۵۱۸
شناسایی هابژنهای مرتبط با گلدهی زعفران ۵۲۰
اعتبارسنجی نتایج با استفاده از بررسی بیان افتراقی ژنهای هاب مرتبط با گلدهی ۵۲۱
فصل یازدهم: توالی یابی و راهبردهای سرهمکردن ژنوم ها ۵۲۳
مقدمه ۵۲۳
توالی یابی ژنوم و پیچیدگی آن ۵۲۴
کاربردهای توالی یابی ژنومها ۵۲۶
توالی یابی خوانش کوتاه و مشکلات سرهمکردن ژنوم ۵۲۶
فنّاوریهای توالی یابی با طول بلند ۵۲۷
توالی یابی به روش SMRT ۵۲۸
فنّاوری ONT ۵۳۱
خوانش های طولانی پیوسته PacBio ۵۳۳
خوانش های بلند و بسیار بلند ONT ۵۳۵
فنّاوری توالی یابی TSLR ۵۳۷
مراحل انجام فنّاوری توالی یابی TSLR ۵۳۷
ویژگیهای ژنومی یوکاریوتها و توالی یابی آنها ۵۴۰
برآورد اندازۀ ژنوم با استفاده از نمودار توزیع K-mer ۵۴۱
اجرای برنامۀ jellyfish ۵۴۲
ترسیم نمودارها در محیط R ۵۴۴
محاسبۀ تعداد کل K-merها ۵۴۴
طراحی بهترین نقشه به منظور توالی یابی ژنوم ۵۵۰
استخراج DNA با کیفیّت ۵۵۱
میزان پوشش و سایر آمارههای مرتبط با توالی یابی ژنومی ۵۵۲
پوشش و مرجع آن ۵۵۳
سیستم کامپیوتری لازم و چگونگی سرهمکردن خوانشهای ژنومی ۵۵۷
تصحیح خطاها در قطعات سرهم شده با استفاده از خوانشهای SGS ۵۵۹
برنامه های سرهمکردن توالی های ژنوم ۵۶۱
برنامۀ HASLR ۵۶۱
اجرای برنامۀ HASLR ۵۶۲
سرهم کردن توالی های حاصل از فنّاوری نسل سوم توالییابی با استفاده از برنامۀ canu ۵۶۳
گزینههای لازم برای همۀ مراحل ۵۶۶
گزینه های لازم برای مرحلۀ تصحیح ۵۶۷
گزینه های لازم برای مرحلۀ سرهمکردن ۵۶۷
گزینه های لازم برای سرهمکردن ژنومهای پلیپلوئیدی ۵۶۸
گزینه های لازم در سرهمکردن دادههای متاژنوم ۵۶۸
گزینه های لازم برای دادههایی با پوشش کم ۵۶۹
گزینه های لازم برای دادههایی با پوشش بالا ۵۶۹
ژنوم های دارای درصد AT/GC بالا ۵۶۹
داده هایی با همسانی کمتر از ۸۰ درصد ۵۷۰
بررسی کیفیّت و کمیّت ژنوم سرهم شده قبل از مستندسازی ۵۷۴
ساخت ژنوم کامل با استفاده از خوانشهای حاصل از روش Hi-C ۵۷۵
فازبندی هاپلوتیپها و سرهمکردن ژنوم ۵۷۷
راهبردهای مبتنی بر همردیفی با ژنوم مرجع ۵۷۸
فازبندی در ژنومهای دیپلوئیدی ۵۷۸
فازبندی در ژنومهای پلیپلوئید ۵۸۱
راهبردهای مبتنی بر سرهمکردن de novo ژنوم ۵۸۳
ژنوم های دیپلوئید ۵۸۴
ژنوم های پلیپلوئید ۵۸۶
نواحی تکراری در ژنومها و راهبردهای سرهم کردن و فازبندی آنها ۵۸۷
سرهم کردن کانتیگهای مربوط به ژنومهای پلیپلوئیدی با استفاده از برنامۀ ALLHIC ۵۹۲
مراحل اجرای برنامۀ ALLHiC بهصورت گامبهگام ۵۹۵
کنترل کیفیت خوانش های همردیف شده ۵۹۶
سرهم کردن ژنوم براساس فازبندی هاپلوتیپها با استفاده از برنامۀ GreenHill ۶۰۸
خوانشهای ورودی ۶۱۱
ادغام هاپلوتیپها ۶۱۲
نقشهیابی خوانشها ۶۱۴
ساخت داربستهای توافقی بهوسیلۀ خوانشهای بلند ۶۱۴
شناسایی یالهای اشتباه به وسیلۀ خوانشهای Hi-C ۶۱۴
مرحلۀ فازبندی ۶۱۷
اجرای برنامه GreenHill ۶۱۹
تهیۀ نقشههای نوری (اپتیکی) بیونانو ۶۲۱
الکتروفورز و خطی کردن DNA ۶۲۳
سرهمکردن de novo نقشۀ ژنوم ۶۲۴
سرهمکردن ژنومهای کوچک ۶۲۵
سرهمکردن ژنوم اندامک ها ۶۲۶
برنامۀ NOVOPlasty ۶۲۶
اجرای برنامۀ NOVOPlasty ۶۲۷
تهیۀ فایل تنظیمات (کانفیگ) ۶۲۸
اجرای برنامۀ NOVOPlasty ۶۳۰
سرهم کردن خوانشهای بلند سینتتیک حاصل از فنّاوری TSLR ۶۳۴
تصحیح کروموزوم باکتری سرهمشده با استفاده از برنامۀ Pilon (genome.fasta) ۶۳۸
فصل دوازدهم: شناسایی محل اتصال پروتئینها در ژنوم (ChIP-Seq) ۶۴۱
مقدمه ۶۴۱
مراحل اجرای روش ChIP-Seq ۶۴۲
همردیفی با ژنوم ۶۴۴
مشخص کردن نقاط غنی ۶۴۵
تجزیهوتحلیلهای پاییندست ۶۴۶
اجرای برنامۀ MACS ۶۴۸
اجرای برنامۀ MACS برای شناسایی مکان اتصال عوامل رونویسی ۶۵۳
اجرای برنامۀ IDR از بسته نرم افزاری phantompeakqualtools برای بررسی تکرارهای مختلف ۶۵۷
اجرای برنامۀ PePr برای دادههای تکراردار ۶۵۹
ارتباط بین پیکها و ژنها ۶۶۲
شناسایی نزدیکترین ژنها به پیکها در ژنوم با استفاده از برنامۀ bedtools closest ۶۶۳
اجرای برنامۀ bedtools groupby ۶۶۵
نمایش بهتر فایل BAM با استفاده از تبدیل آن به قالب bigwig ۶۶۶
روش مستندسازی پیکها با اجرای برنامۀ HOMMER ۶۶۸
مستندسازی پیشرفته ۶۷۵
ترسیم لوگوی موتیفها برای پیکهای شناساییشده ۶۷۶
فصل سیزدهم: اپیژنومیک (متیل سیکونسینگ) ۶۷۹
مقدمه ۶۷۹
متیلاسیون DNA ۶۸۰
جزایر CpG در ژنوم موجودات ۶۸۱
نقش متیلاسیون DNA در سرکوب رونویسی ژنها ۶۸۱
روش توالییابی متیل برای شناسایی تغییرات اپیژنتیکی از نوع متیلاسیون ۶۸۳
همردیفی و پردازش اطلاعات ۶۸۵
اجرای برنامۀ Bismark ۶۸۶
مراحل اجرای برنامۀ bismark ۶۸۷
خلاصه گزارش نتایج برنامۀ Bismark ۶۹۱
مرحلۀ نهایی اجرای برنامۀ Bismark ۶۹۲
گزارش پوشش نوکلئوتیدی بهوسیلۀ برنامۀ Bismark ۶۹۳
فیلتر کردن خوانش های تیمارنشده با بیسولفیت ۶۹۴
فصل چهاردهم: سینتنی، مبانی و ابزارها ۶۹۷
مقدمه ۶۹۷
سینتنی و تکامل ۶۹۸
واژگان ۶۹۸
ژن های همولوگ ۷۰۰
ژن های اورتولوگ ۷۰۰
ژن های پارالوگ ۷۰۰
روشها و ابزارهای تشخیص سینتنی ۷۰۲
کاربردهای سینتنی ۷۰۲
انواع سینتنی ۷۰۳
اجرای برنامۀ MCScanX ۷۰۴
شیوۀ عمل الگوریتم MCScanX ۷۰۴
شمارش تعداد ژن ها در هر یک میلیون جفتباز در فایل ۱۰oryza.bed ۷۱۱
نمایش جایگاه کروموزومی ژنهای مطالعهشده ۷۱۳
اجرای برنامۀ DensityMap ۷۱۴
فصل پانزدهم: فراخوانی SNPها ۷۲۱
مقدمه ۷۲۱
توالییابی ژنوم ۷۲۱
مراحل انجام GBS ۷۲۴
مراحل عملی انجام GWAS ۷۲۶
فراخوانی SNPها ۷۲۶
اجرای بستۀ stacks ۷۲۷
اجرای پایپ لاینها ۷۳۴
برنامۀ ipyrad ۷۳۵
اجرای برنامۀ ipyrad ۷۳۸
فراخوانی SNPها با استفاده از برنامۀ GATK ۷۴۱
کیفیّت نقشه یابی ۷۴۲
واریانتها در خوانشهای تکراری ۷۴۳
مراحل شناسایی SNPها ۷۴۴
فیلتر SNPها ۷۵۳
فیلتر براساس داده های گمشده ۷۵۸
برآورد ژنوتیپ دادههای گمشده ۷۵۸
فصل شانزدهم: پویش گستردۀ ارتباطات ژنومی (GWAS) ۷۵۹
مقدمه ۷۵۹
انتخاب به کمک نشانگر (MAS) ۷۶۰
آشنایی با مفهوم عدم تعادل لینکاژی ۷۶۲
عوامل مؤثر بر LD ۷۶۵
نقشهیابی ارتباطی ۷۶۷
مدل های آماری نقشه یابی ارتباطی ۷۶۷
مدل خطی ۷۶۷
مدل مخلوط چندلوکوسی ۷۶۸
ساختار جمعیت ۷۶۸
روابط خویشاوندی ۷۷۳
نقشه یابی ارتباطی ۷۷۴
مقایسه کلی مدلها ۷۷۴
محاسبۀ ساختار ژنتیکی جمعیتها ۷۷۵
برنامۀ Structure ۷۷۶
تهیه فایل دادهها برای نشانگرهای SNPs ۷۷۶
اجرای برنامۀ Structure در محیط ویندوز ۷۷۷
اجرای برنامۀ structure در محیط پایتون ۷۸۵
نتایج ۷۸۷
تجزیه ساختار جمعیت با استفاده از بستۀ LEA ۷۹۰
مراحل انجام کار ۷۹۰
تجزیۀ GWAS ۷۹۳
دادههای ورودی ۷۹۳
تهیه داده های فنوتیپ ۷۹۴
تهیه داده های ژنوتیپی ۷۹۴
قالب عددی ۷۹۵
تهیه قالب خویشاوندی ۷۹۶
تهیه قالب ماتریس متغیرهای کمکی ۷۹۷
اجرای برنامۀ GAPIT به منظور انجام GWAS ۷۹۸
اجرای بستۀ rMVP برای تجزیه GWAS ۸۰۰
ارائه نتایج GWAS ۸۰۲
نمودارQQ ۸۰۲
نمودار منهتن ۸۰۳
رویکرد GWAS مبتنی بر k-mer ۸۰۹
مبانی GWAS مبتنی بر k-mer ۸۱۱
انواع k-merها و شمارش فراوانی آنها ۸۱۳
روشهای استفادهشده در GWAS مبتنی بر k-mer ۸۱۵
اجرای برنامۀ KmerGWAS ۸۲۳
ساخت ماتریس خویشاوندی ۸۳۰
انجام محاسبات با یک مثال عملی ۸۳۶
رگرسیون جزیی: تعیین اثر هر متغیر ۸۵۱
اجرای برنامۀ kmers_gwas.py ۸۵۶
تجزیه بیشتر k-merهای مهم ۸۵۸
استخراج خوانشهای حامل k-merهای مهم ۸۶۱
تجزیه GWAS با استفاده از برنامۀ rMVP براساس جدول k-merها ۸۶۴
محاسبۀ ساختار جمعیت ۸۶۶
فصل هفدهم: تجزیه تفرق توده (BSA) ۸۷۱
مقدمه ۸۷۱
تجزیه تفرق توده (BSA) ۸۷۲
اجرای بستۀ QTL-Seq ۸۷۳
مستندسازی واریانتهای ژنتیکی ۸۷۸
اجرای برنامۀ SnpEff ۸۷۸
انتخاب ژنهای خاص برای آنوتیشن ۸۸۲
فصل هیجدهم: متاژنومیکس ۸۸۵
مقدمه ۸۸۵
متاژنومیکس عملکردی ۸۸۶
متاژنومیکس مبتنی بر توالییابی ۸۸۹
شناسایی ژنهای مفید با استفاده از متاژنومیک ۸۹۱
ارزیابی متاژنومی دریای سارگاسو ۸۹۳
اکولوژی و متاژنومیک ۸۹۴
شاتگان متاژنومیکس ۸۹۵
کنترل کیفیّت ۸۹۶
سرهم کردن خوانشها ۸۹۶
سرهم کردن خوانشهای خام با استفاده از برنامۀ metaSPAdes ۸۹۷
سرهم کردن خوانشهای خام بهوسیلۀ برنامۀ megahit ۸۹۹
به کارگیری ابزار خودکار MetaPlatanus در مطالعات متاژنوم ۹۰۰
اجرای برنامۀ MetaPlatanus ۹۰۲
کنترل کیفیت نتایج سرهم شده ۹۰۳
استفاده از ابزار متاکواست ۹۰۵
تفکیک متاژنوم به اجزای تشکیل دهنده ۹۰۶
تعیین ارگانیزم های موجود در میکروبیوم ۹۰۸
پروفایلینگ تاکسونومی با متافلان ۹۰۸
تعیین ژنها و عملکرد آنها در متاژنوم ۹۰۹
استفاده از سرور ام جی رست ۹۱۰
بررسی تنوع جمعیت در دست مطالعه ۹۱۲
فصل نوزدهم: راهبردهای تلفیق دادههای اُمیک و تجزیۀ eQTLs ۹۱۷
مقدمه ۹۱۷
مروری بر استراتژیهای تلفیق و تجزیهوتحلیل داده های omics ۹۱۸
متاآنالیز ۹۲۰
تجزیهوتحلیل چندمرحله ای ۹۲۰
تحلیل متابعدی ۹۲۳
ملزومات تلفیق و تجزیهوتحلیل داده های omics ۹۲۶
تجزیهوتحلیل eQTL ۹۲۷
مراحل تجزیۀ eQTL ۹۲۹
مبانی آماری شناسایی eQTLs به وسیلۀ بستۀ Matrix eQTL ۹۲۹
رگرسیون خطی ساده ۹۳۰
مدل با متغیرهای کمکی ۹۳۴
نحوه برخورد با چندخطی ۹۳۶
مدل ANOVA ۹۳۷
هتروژنی خطاها یا ناهمگنی واریانس خطاهای معادلۀ رگرسیون ۹۳۸
نمودارهای Q-Q و هیستوگرام تمام مقادیر p ۹۳۹
نرخ کشف خطا (FDR) ۹۳۹
اجرای برنامۀ MatrixEQTL در محیط R ۹۴۰
فراخوانی برنامۀ MatrixEQTL ۹۴۰
فراخوانی و تنظیم قالب داده ها برای بستۀ MatrixEQTL ۹۴۲
تطبیق مدل های eQTL با MatrixEQTL ۹۴۳
تجزیه سیس و ترانس eQTL ۹۴۴
مشاهدۀ نتایج ۹۴۵
فصل بیستم: هوش مصنوعی: یادگیری ماشین در ژنومیک و ترانسکریپتومیک ۹۴۹
مقدمه ۹۴۹
مقدمه ای بر روشهای یادگیری ماشین در علم ژنتیک ۹۵۰
کاربرد روشهای یادگیری ماشین در حوزههای مختف زیست شناسی مولکولی ۹۵۳
انتخاب ژن ۹۵۴
مراحل انجام انتخاب ویژگی ۹۵۷
روش انتخاب رو به جلو ۹۵۷
روش انتخاب رو به عقب ۹۵۸
مقایسه دو روش انتخاب رو به جلو و رو به عقب ۹۵۹
انتخاب دومسیره (انتخاب گامبهگام) ۹۶۰
راهبردهای جستوجو ۹۶۱
رویکردهای انتخاب ویژگی ۹۶۲
الف) رویکرد انتخاب ویژگی Filter ۹۶۲
ب) رویکرد انتخاب ویژگی Wrapper ۹۶۳
ج) رویکرد انتخاب ویژگی Embedded ۹۶۵
د) رویکرد انتخاب ویژگی ترکیبی ۹۶۶
ه) رویکرد انتخاب ویژگی گروهی ۹۶۶
روش Bagging ۹۶۸
روشPasting ۹۶۸
روش Boosting ۹۶۸
تفاوتهای کلیدی بین روشهای ترکیبی و گروهی ۹۶۹
معیار توقف ۹۶۹
ارزیابی نتایج ۹۷۰
الف) ماتریس درهم ریختگی ۹۷۳
ب) اعتبارسنجی متقابل (w) ۹۷۴
ج) ویژگی های بهینه سازی گیرنده (ROC) ۹۷۵
برازش آماری ۹۷۷
راهکارهای مقابله با بیش برازش ۹۷۹
دلایل کمبرازشی در مدلها ۹۸۱
راههای مقابله با کمبرازشی ۹۸۱
برازش خوب در یادگیری ماشین چیست؟ ۹۸۱
تشکیل مجموعۀ آموزش و آزمون ۹۸۲
مسئله تعداد ویژگیها و تعداد نمونهها ۹۸۴
ملاحظات عملی درباره مطالعات ترانسکریپتوم و ژنومیک ۹۸۵
تبیین مسئلۀ تعداد نمونه در مطالعات ژنتیکی ۹۸۶
راهکارهای کاهش اثر تعداد نمونههای کم ۹۸۸
بهکارگیری توأم الگوریتمهای طبقه بندی کننده و انتخاب ویژگی ۹۸۹
انتخاب ژن تحت نظارت ۹۹۱
مزیتها ۹۹۲
انتخاب ژن بدون نظارت ۹۹۶
انتخاب ژن نیمه نظارت شده ۹۹۷
الگوریتمهای رویکرد یادگیری ماشین تحت نظارت ۹۹۸
رگرسیون لجستیک ۱۰۰۰
رگرسیون لاسو ۱۰۰۲
مزایای رگرسیون لاسو ۱۰۰۴
واژهشناسی ۱۰۰۶
ساخت درخت ۱۰۰۶
تقسیم در دادههای طبقهبندی ۱۰۰۷
بهرۀ اطلاعات ۱۰۰۸
فرآیند تقسیم در مدلهای مبتنی بر رگرسیون ۱۰۰۹
تقسیم ویژگیهای طبقهبندی ۱۰۱۱
تقسیم ویژگیهای عددی ۱۰۱۲
ساخت درخت تصمیم برای مدلهای رگرسیون ۱۰۱۵
الگوریتم جنگل تصادفی ۱۰۱۷
الگوریتم XGBoost ۱۰۲۳
شرایط استفاده مؤثر از الگوریتم XGBoost ۱۰۲۳
تقویت گرادیان برای متغیر هدف پیوسته (رگرسیونی) ۱۰۲۴
تقویت گرادیان برای متغیر هدف طبقهای ۱۰۲۹
الگوریتم AdaBoost ۱۰۳۲
اجرای الگوریتم AdaBoost برای دادههای طبقهای ۱۰۳۳
اجرای الگوریتم AdaBoost برای دادههای پیوسته (مدل رگرسیون) ۱۰۳۹
ساخت مجموعه دادۀ اصلاحشده ۱۰۴۲
ماشین بردار پشتیبان ۱۰۴۸
نحوۀ عملکرد SVM ۱۰۴۹
گاما پارامتر SVM gamma)) ۱۰۵۱
پارامتر (regularization) C ۱۰۵۳
انواع هستههای SVM ۱۰۵۵
هسته SVM چندجملهای ۱۰۵۵
هسته تابع پایه شعاعی ۱۰۵۵
هستۀ تابع سیگموئیدی ۱۰۵۷
مزایا، معایب و شرایط استفاده از الگوریتم SVM ۱۰۵۷
شرایط استفادۀ مؤثر از SVM ۱۰۵۸
نزدیکترین همسایه (KNN) ۱۰۵۹
مقایسه الگوریتمها ۱۰۶۰
روشهای یادگیری ماشین تحت نظارت ۱۰۶۳
اجرای الگوریتم SVM-RFE در محیط R برای مجموعه دادۀ SNP با متغیر هدف پیوسته ۱۰۶۳
اجرای الگوریتم SVM-RFE در محیط R برای مجموعه دادۀ ترانسکریپتوم با متغیر هدف طبقهای ۱۰۶۹
ساخت ماتریس درهمریختگی ۱۰۷۱
محاسبۀ AUC برای مدل بالا ۱۰۷۳
اجرای الگوریتم XGBoost ۱۰۷۴
اجرای رگرسیون لاسو ۱۰۷۷
معیاره های مختلف ارزیابی نتایج برای روش رگرسیونی در لاسو ۱۰۸۱
ارزیابی مدلها روی دادههای آزمون برای مدل دوجملهای ۱۰۸۵
ارزیابی مدلها روی دادههای آزمون برای مدل پوآسن ۱۰۸۷
اندازهگیری کارآیی مدل ایجادشده ۱۰۸۷
اعتبارسنجی متقابل ۱۰۸۷
ساخت ماتریس درهمریختگی و نمودار ROC برای دادههای طبقهبندی ۱۰۸۸
منحنیهای ROC برای دادههای متغیر هدف دوجملهای ۱۰۸۸
روش یادگیری ماشین بدون نظارت ۱۰۹۱
اجرای برنامۀ Omada ۱۰۹۱
انتخاب مناسبترین رویکرد خوشهبندی براساس مجموعه داده ۱۰۹۵
استخراج نتایج ۱۰۹۶
انتخاب مناسبترین ویژگیها ۱۰۹۶
برآورد بهینهترین تعداد خوشهها ۱۰۹۷
اجرای خوشهبندی بهینه ۱۰۹۹
واژهنامه ۱۱۰۱
زبانهای برنامهنویسی ۱۱۰۱
ابزارهای توالییابی و شیمی آن ۱۱۰۳
تجزیهوتحلیل بیوانفورماتیک ۱۱۱۰
انواع فایل ۱۱۱۴
دستورات کاربردی قابل اجرا در ترمینال لینوکس ۱۱۱۸
مراحل نصب برنامه های تجزیۀ داده های NGS از مخزن conda ۱۱۲۴
مراحل نصب برنامه های تجزیۀ داده های NGS از مخازن Bioconductor و CRAN ۱۱۲۵
منابع ۱۱۲۷
نمایه ۱۱۳۵
دسته بندی موضوعی | موضوع فرعی |
كشاورزي و منابع طبیعی |
کشاورزی
|