Gao Lab测试-2023 发表于2023年6月15日2024年5月13日 SPAN> 由yangdc SPAN> 本测试的目的是帮助你检查在实验室进行生物信息学研究与学习所需的基础知识与基本技能,你应在收到Access Code之后24小时之内独立完成测试。若答案提交时间超过了收到Access Code的时刻+24小时,则提交的答案无效。 其间,你可以: 自行通过网络查找资料,独立完成; 多次尝试,最终分数以最后一次提交为准。 你不能: 抄袭; 剽窃。 本试题共计20道题,包含选择、填空、问答题,选择题均为不定项选择题。为了保证题目的有效性和公平性,请勿转发和分享。 姓名 Email 手机 Access Code 1. A. O(n) B. O(n*log(n)) C. O(n^2) D. O(n^3) 2. 给定程序初始状态: x = 0; y = 0;假设有下面两个共享内存的并行线程: 线程一:x = y + 1; print(y); 线程二:y = x + 1; print(x); 已知程序执行满足顺序一致性且所有分号分隔的语句均为原子操作,可能会打印出以下哪些结果: A. 线程一:1;线程二:1 B. 线程一:2;线程二:1 C. 线程一:0;线程二:1 D. 线程一:2;线程二:0 3. 以下脚本是使用python2编写,那么请问脚本最终的输出为?请将结果填入下面方框: 4. 以下哪一个选项是错误的: A. 主成分分析 (PCA) 可以直接用设计矩阵 (design matrix) 的特征值分解来计算 B. 高斯核函数能把原空间映射到无限多维 C. 决策树可以用来做回归 D. ROC曲线下面积常被用来衡量分类模型的好坏 5. 请自行在arXiv搜索1710.10547这篇文章的摘要,然后判断以下哪些说法是错误的: A. 这篇文章提到的Saliency maps, relevance propagation以及DeepLIFT都是用来做预测的深度学习模型 B. 这篇文章认为,“interpretation”是不靠谱的,因为同一个模型在面对两个长得很像、但是分类标签不一样的图片时,可能会把它们判定为是同一类图片 C. 这篇文章的分析过程中没有涉及到二阶导数 D. 这篇文章认为,"interpretation"变化的时候,预测结果会跟着一起变 6. 请自行在arXiv搜索1710.10547这篇文章的全文,然后判断以下哪些说法是正确的: A. 这篇文章用到的CIFAR-10分类模型只有一种大小的卷积核:3乘3 B. top-k attack会对原始输入图像上RGB绝对值求和最大的像素点进行修改 C. Figure 3的结果是在ImageNet数据集上做出来的 D. 附录E解释了为什么influence function要比importance-feature methods效果更差 7. 在人类基因组chr5:40490609-40490609(hg19)的位置上发生的C>T突变,下列说法正确的是: A. 该突变位于基因组编码区域 B. 该突变所处位置没有H3K27ac修饰 C. 该突变可能通过影响增强子的功能发挥作用 D. 该突变处于基因组非编码区,无功能 8. 相较于一代(Sanger)和三代(SMRT)而言,二代测序(Illumina)的局限性有哪些? A. 价格最贵 B. 通量最低 C. 读长最短 D. 错误率最高 E. 样本制备及建库步骤最复杂 9. 以下哪几种酶被用来检测染色质开放性: A. DnaB B. M.CviPI C. DNase I D. MNase E. Taq F. Tn5 10. 以下哪一种分布可以写成泊松分布的伽玛混合: A. 高斯分布 B. 狄利克雷分布 C. 负二项分布 D. 超几何分布 11. 以下关于两个随机变量观测值的哪些说法是错误的: A. 如果Pearson相关性为零,代表它们相互独立 B. 如果Spearman相关性为零,代表它们相互独立 C. 如果互信息为零,代表它们相互独立 D. 如果KL散度为零,代表它们相互独立 12. 以下哪些降维/可视化方法是线性的: A. PCA B. UMAP C. tSNE D. NMF 13. 以下哪些基因组DNA序列的突变可能会影响生物个体的表型? A. 开放读码框 (Open Reading Frame) B. 5端UTR C. 3'端UTR D. 启动子 E. 增强子 F. 基因间区 14. 以下哪些关于CRISPR技术的陈述是错误的? A. CRISPR即是Cas9 B. CRISPR的唯一用途是通过切割DNA来编辑基因组 C. CRISPR是第一个基因编辑系统 D. Cas9对于DNA的切割是精准无误的 15. 以下关于肿瘤微环境的说法哪些是正确的: A. 除肿瘤细胞外仅包含肿瘤浸润免疫细胞 B. 肿瘤细胞既受微环境中其他细胞的影响,也会主动影响其他细胞 C. 肿瘤微环境中胞外基质与正常组织中胞外基质不同 D. 肿瘤微环境中的免疫细胞都是促进肿瘤生长的 16. scRNA-seq测序中的doublet通常有什么特点: A. 表达基因偏少 B. 表达基因偏多 C. 同时拥有多个不同的cell barcode D. 同时表达多个细胞类型的marker 17. RNA velocity采用哪种信息来判断细胞状态变化方向: A. Poly-A长度 B. Intron read数 C. Housekeeping基因表达量 D. Non-housekeeping基因表达量 18. 以下哪些空间转录组方法可以检测单细胞边界(Cell Segmentation): A. Slide-seq B. MERFISH C. FISSEQ D. seqFISH 19. 存在样本:samplenames = [“1”,”2”,”3”…”100”], 各样本的权重为weights = [1,2,3,..100], 请自己设计算法,并给出代码或伪代码,对这100个样本按权重无放回抽样,随机抽取50个样本(请勿直接调用带权抽样函数)。 20. 可将你的想法/意见与建议写在下面 谢谢填写! 请确认后,按下方按钮提交答案。 Time's up