Gao Lab测试-2024 发表于2024年5月13日2024年6月26日 由yangdc 本测试的目的是帮助你检查在实验室进行生物信息学研究与学习所需的基础知识与基本技能,你应该在自己开始答题后24小时之内独立完成测试,超过24小时的提交将无效,最晚提交时间不晚于6月25日晚18点。 其间,你可以: 自行通过网络查找资料,独立完成; 由于本测试为题库随机抽题,答题期间请勿关闭网页,再次进入题目由于设备原因有概率会重新抽取。 多次尝试,最终分数以最后一次提交为准。 你不能: 抄袭; 剽窃。 本试题共计20道题,包含选择、填空、问答题,选择题均为不定项选择题。为了保证题目的有效性和公平性,请勿转发和分享。 姓名 Email 手机 Access Code 1. 以下脚本是使用python2编写,那么请问脚本最终的输出为?请将结果填入下面方框: 2. 以下关于Transformer里 Attention的叙述,错误的有: A. Transformer的Attention指的是Single-Head attention 里Q和K的矩阵乘法得到的矩阵 B. Transformer的Multi-Head Attention 可以学习到输入序列中不同位置的关系 C. Transformer的每一层Single-Head attention在计算时是相互独立的 D. Transformer的attention机制没有使用到残差计算 3. 以下哪些数据有助于关联基因及其远距离顺式调控元件: A. miRNA表达量 B. CLIP-Seq C. eQTL D. Hi-C 4. 阅读文献https://www.nature.com/articles/s41591-023-02371-y, 总结CD8+耗竭T细胞富集的功能通路: A. Naïve B. Cytotoxicity C. IFN response D. TCR signaling 5. 考虑如下的花童卖花问题: 一位花童每天早上去花店买花,买入价1元/支;白天在街上卖花,卖出价3元/支;晚上将没卖出的花扔进垃圾桶;即对于早上买的花,若卖出了则净赚2元/支,若没卖出则赔1元/支。经过长期观察,花童发现每天买花的需求支数近似服从均值为128、标准差为28的正态分布,则花童每天分别应当买入多少支花使收益期望最大? A. 100 B. 110 C. 120 D. 128 E. 130 F. 140 G. 150 H. 156 I. 184 6. 以下哪些基因组DNA序列的突变可能会影响生物个体的表型? A. 开放读码框 (Open Reading Frame) B. 5端UTR C. 3'端UTR D. 启动子 E. 增强子 F. 基因间区 7. 以下哪个组学特征和基因表达量通常是负相关的: A. Promoter开放性 B. Promoter mCG甲基化 C. Gene body开放性 D. Gene body mCG甲基化 8. 现有如下p值:0.001, 0.003, 0.006, 0.01, 0.02, 0.15, 0.25, 0.46, 0.68, 0.79。第1个p值使用Bonferroni correction 后的数值是: A. 0.0001 B. 0.01 C. 0.05 D. 以上均不对 9. 请自行在NCBI上搜索相关信息,然后判断以下哪些说法是错误的: A. Linc2GO算法的主要目的是根据竞争性内源RNA的机制推测microRNA和lincRNA的功能 B. lncRNA-MFDL是基于深度学习预测lncRNA具体行使的生物学功能的 C. 目前基于 CRISPRi 方法测定lncRNA功能的研究里,暂时还没有涉及到lncRNA在干细胞中的功能 D. 目前用在lncRNA领域的深度学习模型里,没有模型同时整合了CNN(卷积神经网络)和RNN(循环神经网络) 10. 以下哪些单细胞测序方法可以同时检测RNA和蛋白的表达量: A. scM&T-seq B. CITE-seq C. scATAC-seq D. sci-CAR 11. 以下哪几种方法可以消除scRNA-seq表达量定量的扩增偏差(amplification bias): A. Unique molecular identifier B. Cell barcode C. In vitro transcription D. 高效PCR扩增酶 12. 存在样本:samplenames = [“1”,”2”,”3”…”100”], 各样本的权重为weights = [1,2,3,..100], 请自己设计算法,并给出代码或伪代码,对这100个样本按权重无放回抽样,随机抽取50个样本(请勿直接调用带权抽样函数)。 13. 在R中运⾏以下程序,希望先输出"Evaluating x",后输出"Evaluating y",然后报错"Error!",请简洁地补全缺失的部分。 f <- function(x) { print("Evaluating x") x * 2} g <- function(y) { print("Evaluating y") y + 2} h <- function(a, b) {(a) + (b)} h(1, stop("Error!")) 14. (可以在word中编辑完成后复制过来,亦可拍照发送到我们的邮箱) 15. 以下哪些组学技术现在可以做到单细胞精度: A. transcriptomics B. methylome C. 3d genome D. Proteomics 16. 以下哪些降维/可视化方法是线性的: A. PCA B. UMAP C. tSNE D. NMF 17. 假设a 和b 是两个形状相同的PyTorch张量,以下哪些操作产⽣的结果⽀持⾃动回传梯度到 a ? A. a.half() B. a.long() C. a.exp() D. a.cuda() E. b.scatter_add_(0, torch.arange(1), a) F. b[0] = a[0] G. D.Uniform(a, b).sample() 18. 请自行在arXiv搜索1710.10547这篇文章的全文,然后判断以下哪些说法是正确的: A. 这篇文章用到的CIFAR-10分类模型只有一种大小的卷积核:3乘3 B. top-k attack会对原始输入图像上RGB绝对值求和最大的像素点进行修改 C. Figure 3的结果是在ImageNet数据集上做出来的 D. 附录E解释了为什么influence function要比importance-feature methods效果更差 19. 相较于一代(Sanger)和三代(SMRT)而言,二代测序(Illumina)的局限性有哪些? A. 价格最贵 B. 通量最低 C. 读长最短 D. 错误率最高 E. 样本制备及建库步骤最复杂 20. 以下哪些模型可以产生对抗样本: A. 卷积神经网络 B. 递归神经网络 C. SVM—支持向量机 D. 线性回归 可将你的想法/意见与建议写在下面 谢谢填写! 请确认后,按下方按钮提交答案。 Time's up