Ref:转录调控的相分离模型
A Phase Separation Model for Transcriptional Control 【2017】 Coactivator condensation at super-enhancers links phase separation and gene control【2018】

- 这篇文章是2018年7月发在science上的文章,主要讲的是参与转录过程的一些因子在超级增强子附近发生相分离形成condensates调控转录的过程从实验上来验证他们2017年cell上提出的相分离参与转录调控的理论模型

- 首先介绍下背景相分离:真核细胞内一些含有特定序列特征的蛋白质或者核酸 通过疏水、静电作用,形成一些微米级别的无膜的,液滴一样的结构的过程。形成的结构叫做condensates 或者puncta这种结构可以将分子富集在一定的区域内,也可以将一些参与反应或者不利于反应发生的分子排除在外,调控细胞内生理反应的发生另一方面,这种结构是高度动态的,可以不断的和周围的分子发生交换,当环境发生变化时,可以进行解离或聚集

- 增强子,一类DNA调控元件,可以结合转录调控的一些蛋白,促进上下游的基因表达(距离最远1Mb)而超级增强子由许多这样的增强子组成,促进基因表达的效果更明显,在其周围存在许多转录相关的因子,可以激活不同的基因同步表达,它促进的转录过程很容易被转录调控蛋白的blocker扰乱。

- 而这些性质,可能可以用相分离来解释,比如通过相分离,转录因子和一些互作的辅助因子可以在SE附近富集而这个过程本身也是高度动态的,通过相分离形成condensates或者解聚,来起始或者终止转录过程所以他们认为在超级增强子附近发生了相分离的过程,将转录相关的因子富集在这个局部的区域,高效的促进基因的表达,另一方面,在增强子附近形成相分离的过程,可以将很多gene 拉到这个区域,也可以解释为什么增强子为什么可以促进基因的同步表达

- 在提出了这个模型之后就开始进行实验验证。这篇文章主要选择的是两个在超级增强子附近富集的转录相关的蛋白,在mESC细胞中进行验证BRD4:可以磷酸化RNA Pol II的CTD,促进RNA Pol II从转录起始位点释放,起始转录MED1:mediator的一个亚基,可以和BRD4一起用来定义SEs(它们都是转录复合物相关的蛋白)文献报道,CHIP数据表明,SE在BRD4和MED1结合的区域富集DNA互作的数据说明,SE中被BRD4和MED1结合的地方,在空间上接近(所以用这两个蛋白来进行验证)(RPM reads per million)(CHIA-PET,配对末端标签测序)(甲醛固定后,用特定的抗体拉蛋白,之后测序,看这些蛋白结合的序列)所以选择这两个蛋白来进行实验

- 首先,为了验证一下,这两个蛋白在细胞内会不会形成小的puncta,一方面,在固定完细胞后,分别通过BRD4 MED1的抗体进行免疫组化,观察荧光,发现在细胞核中可以观察到很多这种小puncta的结构

- 另一方面,为了判断在内源情况下,在活细胞内是否可以形成这种puncta,通过CRISPR/Cas9的同源重组,在内源的BRD4和MED1 N端加上荧光标签 (可能是因为IDR主要在C端)也可以观察到核内形成很多puncta,在每个核中大概有1000个左右的BRD4 MED1puncta.


- 进一步确认这种结构能否在超级增强子的附近形成,通过DNA-FISH、RNA-FISH 靶向Nanog基因和它的SE,验证puncta是不是在SE附近形成(IF也是单一的),有100多个FISH位点的中心存在puncta,而随机挑选序列做FISH,观察不到这种趋势(在除了Nanog以外的几个基因附近的增强子也可以观察到类似的现象,【Mir290 Klf4 Trim28】在没有和SE耦联的基因附近观察不到类似的现象)说明这两个蛋白可以在超级增强子的附近形成puncta

- 但是puncta具不具备相变的性质?比如在体内
- 1)是否能和周围环境的分子发生交换
- 2)可不可以被已知的扰乱相变形成的分子破坏在体外
- 3)这种puncta的形成是否是浓度依赖的
- 4)在环境改变过程中,puncta的大小、数量是否会发生变化

- 首先,在mESC内源带有mEGFP的MED1 BRD4细胞系中进行FRAP荧光漂白恢复,在漂白后,荧光可以在短时间内恢复,说明这种结构是高度动态的,可以和周围环境中的分子发生交换扩散的速率大概在 ~0.37 ± 0.13 and ~0.14 ± 0.04 um2/s,

- 另一方面这种快速的交换是能量依赖的过程【ATP可以通过能量依赖的过程,或者它自身的疏水活性 促进condensate的流动性】通过葡萄糖饥饿和寡霉素(抑制ATP的合成)去除ATP,进行FRAP,发现BRD4的恢复速率下降,MED1的恢复速率完全消失会下降

- 之后,验证了一下已知的相变的扰乱剂,1,6- 己二酮可以扰乱liquid-like condensates的形成,在1,6- 己二酮处理之后,mESC中内源的BRD4和MED1的puncta的数目减少,说明形成的puncta可以被这个扰乱剂扰乱

- 虽然这种puncta的结构被扰乱,但是这些蛋白结合的功能是否受到影响?在超级增强子附近的结合是不是会减少?在用1,6- 己二酮处理之后,通过CHIP-Seq发现,BRD4 MED1在超级增强子附近结合的occupacy下降,说明相变过程的扰乱,会阻止这些转录调控因子在超级增强子附近的结合

- 另一方面,这种相变的扰乱,是否会影响转录水平,同样通过RNA Pol II在超级增强子附近的occupacy的变化来看,在扰乱之后,RNA Pol II的结合减少,而这些RNAPolII发生下降的地方主要是SE驱动的基因,TE驱动的基因的结合下降比例少,从侧面说明condensates的扰乱导致转录的活性下降

- 在体内验证完之后,在体外验证一下它们的性质,这种相变的发生是不是由MED1和BRD4的IDR产生,首先通过PONDR(Predictor of Natural Disordered Regions)预测,确认MED1和BRD4的IDR区域,主要集中在C端,在体外分别纯化IDR-mEGFP蛋白,发现在含有10%PEG的buffer中,蛋白溶液会变得浑浊,在显微镜下可以观察到小液滴的形成

- 在测试的最低浓度时也可以形成puncta

- (验证一下它们的浓度依赖的性质,受盐浓度影响)进一步确认下,这种过程是否是浓度依赖的过程,随着蛋白质浓度的增加,puncta形成的大小和数目都会增加,而在对照组的GFP组不会观察到这个现象是否会被盐浓度所影响

- 另一方面,形成的相puncta结构是否是可逆的,直接进行稀释,如果是agg就没办法产生变化,如果是小液滴,就会随着浓度下降,变得小一点(数量和浓度都会下降),用高盐或者等盐浓度的稀释形成的puncta会减小,从A395nm的吸光度【puncta】来看。说明这种结构是可逆的,
- 这些结果可以说明,相变可以响应环境中浓度的变化,比如拿突触来说的话,在膜附近会产生离子浓度的快速变化,这个时候相变的形成就可以被扰乱但是细胞质和细胞核中会不会有局部的一些变化,未知(因为目前所知道的主要是离子浓度的变化产生的影响,其他分子浓度的变化产生的影响还未知)


- 接下来看一下,在体内能否形成这样的droplets【optoIDR】CRY2:隐花色素基因,在蓝光诱导下会聚集在一起,所以可以增加在局部的IDR的浓度在蓝光诱导之后,可以观察到小液滴的形成,而且可以观察到小液滴在细胞内逐步的融合,具有流动性,具有动态性

- 同样的,这种结构在进行荧光漂白后也可以恢复,进一步说明这个过程是高度动态的

- 接下来他们对这个序列的保守型进行了一下分析首先对MED1的氨基酸组成进行了统计,发现在IDR区域,serine丝氨酸的含量很高,而且这一特征在脊椎动物中保守存在将MED1中所有的serine突变后,发现serine对于IDR相变非常重要,全部突变掉serine MED1 IDR无法形成相变(S to A)

- 最后,验证了一下功能方面的,在体外,这个droplet能不能富集转录相关的因子摸索了MED1-IDR可以形成相变而BRD4-IDR不能形成相变的条件,看MED1-IDR可不可以富集BRD4

- ((mCherry–MED1-IDR and mEGFP–BRD4-IDR) 为了防止是因为相变是有孔体系,将葡聚糖连接荧光标记,形成比mEGFP–BRD4-IDR相同分子量小的分子,看这个过程是否是一个主动的过程,而不是被动的有孔特性,可以进入到condensates的内部【验证这是一个分子互作的主动的过程,而不是有孔特性】

- 接下来看这个droplet能不能富集cell extracts中的其他分子,droplets的密度比细胞提取物的密度要大,所有首先将这个体系加入到细胞提取物中,之后通过离心来看可不可以富集细胞提取物中一些转录相关的蛋白免疫组化的结果表明,可以富集BRD4和RNA Pol II的亚基(RPB1)

- 在体外转录的体系中加入MED1-IDR的droplet可以终止转录反应,说明它的确可以影响到转录方面的功能合成的RNA具有自放射性,将其作为Readout.

- 讨论:TF中activation domain中包含有IDR染色质的结构可以被这些condensates影响,将一些元件或者基因富集在一定的空间内Qusetions:condensation是怎么调控转录的输出的(condensation形成的时间?大小?)什么驱动condensation的形成和解离其他转录调控元件的model是不是也是这样,还是有其他的方式为什么有的蛋白参与常染色质condensates的形成,有的蛋白参与异染色质的condensates的形成在疾病过程中,会不会这种转录调控的过程发生了错误的调控(一些疾病是由IDR内的突变导致,在肿瘤细胞中,原癌基因的上游存在特别大的SE)
其他想法:
在这之后,陆续报道了一些关于相分离的文章,比如相分离调控染色质结构、相分离调控转录复合物的switch,相分离参与到核仁蛋白的修复过程。相变在细胞中普遍存在,始终存在说明相变对于生物的功能发挥具有比较重要的作用,相变失调是一些疾病的病理病因,也可以从相变的角度来重新审视相关疾病。
但是对于自己研究的问题有什么帮助,需要自己仔细斟酌。假设这个过程当中的确发生了相变,然后呢?扰乱相变,影响了功能的发挥,对于解释自己的课题提出的假设是否有确确实实真实的推进。
下面是整理的关于相分离的一些内容。阅读文献和结合公众号推文(BioArt)之后的整理。
- Refernce:Biomolecular condensates: organizers of cellular biochemistry (Review 2017 https://www.nature.com/articles/nrm.2017.7)
- Considerations and Challenges in Studying Liquid-Liquid Phase Separation and Biomolecular Condensates(Leading edge 2019 https://www.sciencedirect.com/science/article/pii/S0092867418316490?via%3Dihub)
- https://mp.weixin.qq.com/s?__biz=MzA3MzQyNjY1MQ==&mid=2652466765&idx=1&sn=69db0f48d406cc6481caa23b851fe2bd&chksm=84e2fdf9b39574ef7bb064bd95d42422329090964ef54a87d04c3f9e62eb0c60e61be36e2874&scene=7&key=95b17fddd06e963c4df81507cc619643b12e4001fe7c7dac29c5883af9f3995478d83228d88b10f35fcf2ce3332d420133faf948acd490b2c1e5c464299a44b7bfea13b71971c0752056de7a302390ea&ascene=0&uin=MjMzOTg1NjIw&devicetype=Windows+10&version=62060833&lang=zh_CN&pass_ticket=YoVVJT9WC911ruBon1xh0C3asNQLgR9eK%2Fu1b5M%2BVkQ%3D
- A User’s Guide for Phase Separation Assays with Purified Proteins

- Biomolecular condensates: organizers of cellular biochemistry Biomelocular condensates :真核细胞内形成的微米大小级别、无膜但可以聚集蛋白和核酸的liquid-like结构,分布在相应的地方(不知道在胞质或者细胞核内分布位点是不是有一定的规律),其中一个比较重要的特征是multivalent macromolecular interaction(一个蛋白含有多个互作结构domain,可以是分子间互作也可以是分子互作,intra- and inter-molecular,modular interaction domain (strong),disordered regions provide multiple weakly adhesive sequence elements, intrinsically disordered regions (IDRs,常不含芳香族、脂肪族氨基酸) LCR 低复杂度序列区(序列不复杂,有重复,氨基酸类型少,带电残基 ser、tyr、asp,RGG arg,)),
在condensate内部也可以形成subcompartments,这些结构可以稳定存在几小时、几天,另一方面通过漂白恢复的方法发现它们也可以和周围进行频繁的分子exchanging,也可以进行融合。
可以形成相变的分子:蛋白-蛋白、蛋白-核酸,(一个condenastes可能有10-几百种),仅有一小部分蛋白在生理浓度下可以发生相变从功能方面来看,只要有蛋白或者核酸参与的复杂过程都可能发生相变,所以需要了解相变的大方向的功能,在特定的反应中去思考可能可以怎样工作。另一方面,结合细胞类型来看,不同细胞类型undergo such progress 可以发挥怎样的功能【但是这些结构的组成成分、怎样组装、性质、功能是怎样调控的】
- 和macromolecular assemblies大分子复合物的不同点在于:
- 结构上:
- 1)更大,可被直接观察到
- 2)大小、体积上可以产生相应的变化
- 3)组成成分可以发生变化,而大分子复合物的组成和大小比较固定
- 功能上:
- 1)大分子复合物的反应时间us-ms timescale,而condensates反应时间可能是minutes regime
- 2)相变体系内部的结构可能不是均一的,异质性的,
- 3)大分子复合物的功能主要是通过构象的改变来调节,condensates的活性怎么调控的还不清楚(可能是通过修饰或者分子伴侣的结合来调控)
- condensates的调控组装:
- 1)控制浓度,超过浓度阈值才会相变(但是如果用这种方式来调控相变,在功能方面,不能判断是相变形成的影响,浓度的改变造成的影响,所以还是突变,完全破坏相变的性质比较好,但可以作为辅助方法来验证,)【改变蛋白表达,蛋白降解,蛋白定位】
- 2)可以通过改变valency(改变结构、对蛋白进行修饰),改变环境可溶性来调整形成相变的阈值【也可以作为一种扰乱蛋白正常功能的方式,类似于限制它的分布】
- 3)遗传方面可以改变互作domain氨基酸的长度、数量、patterning、不同的连接类型【需要你知道其他可以形成相变的蛋白的结构】
调控组成成分:(也可以是一种干扰手段)组成是高度变化的,其中一部分作为组成性成分,一直都在,另一部分是限时的,只在某个特定的阶段参与(scaffolds: resident molecules essential for formation of the structure,clients:dispensable for biomolecular condensate assembly.)可以人为设计支架蛋白polySUMO–polySIM,然后在目标蛋白上加上SUMO、SIM标签,改变支架蛋白SUMO和SIM的比值来调整组成,也可以在目标蛋白上多加几个SUMO,增强结合,调整组成一方面可以突变支架蛋白本身,或者突变client蛋白

物理性质:maturation:fluid to gel to solid另一方面,细胞可能会通过某种方式来限制这种mature,或者通过某种方式来维持这种高度动态的性质,(不能一动不动、完全静止,生物中大部分的过程都是处于高度动态的状态来发挥功能的)可以处于这三种状态中的一种fluid:相对无序,短距离范围内有序分布

多相相变:multiphase biomolecular condensatessecondary condensed phases within the primary condensed phase(不同的表面张力)
功能:细胞保证在正确的时空间内进行合适的生化反应,通过调控它们的定位,将它们富集在一定区域内,或者将它们从某些区域进行排除,(eg,蛋白水解)在有膜结构中,可以通过特定的膜蛋白转运机制,实现上述功能而对于一些无膜的结构,也可以实现上述功能,但如何对分子进行富集、维持、调控,控制内在组成成分的变化,调控内部分子的活性。
1)可能增加浓度(也可能和胞质的浓度一样),加快反应速度,或者完全隔绝反应(特异性很强的反应),但是也可能对于速度效率没什么影响(对于非特异的反应)【比如对于内部的大分子,移动会受到影响】调控反应速度和反应的特异性(反应或者不反应),反应的位置(analogously to classical scaffolding molecules in signalling pathways, which bind multiple, selected pathway components simultaneously to provide spatial proximity and structural organization, thus enhancing flux and selectivity)
2)成为特定的微环境状态,稳定特定的分子,为特定的反应提供条件
3)从调控方面来看,如果有的分子仅在这种相变的条件下反应,可以作为快速响应的一种机制,物质都存在,一个cue来集结它们【switchable】


例子:1830s,核仁 nucleolusP granules (germ cell;2-4 um,比较大的结构;RNA+Protein),可以exchange、flow、deform、fission,fusion(交换、变形、融合、分裂)

异染色质、核孔复合物的膜通道,细胞膜上的膜受体也通过液-液相分离形成https://media.nature.com/original/nature-assets/nrm/journal/v18/n5/extref/nrm.2017.7-s6.pdfmedia.nature.com

相变可以实现的功能,通过膜结构也都可以实现,差别之一在于,相变的可变性更高,相对于膜结构更容易拆散,调控更加灵活,方便,也不需要带上特定的膜结构转运标签。膜结构更加稳定,相变在不断的振荡、改变。膜结构可以维持相对稳定的离子环境,而相变主要是大分子,没有一个barrier,小分子没有办法被restrain。这两种方式可以作为互补的方式来organizing cellular contents
【原核不知道有没有?没搜到,如果原核没有,只有真核有,这种机制又有利于发生一些反应的话,为什么不采取这种方式?】
一些pipeline:【具体还是读原文根据自己的需求来获得比较好】 Reference: Considerations and Challenges in Studying Liquid-Liquid Phase Separation and Biomolecular Condensates影响因素:1)大分子本身的性质、浓度2)the environmental conditions including temperature, salt type and concentration, co-solutes, pH, and the volume excluded by other macromolecules.预测结构的算法,分析氨基酸序列的性质,预测无序的结构,以FUS蛋白为例,前250个aa为无序序列,如果不知道结果代表什么,可以对照图例来看富含arg和芳香氨基酸的motif对于相变形成比较重要。

分析预测的工具:
- IUPred and PLAAC,前250个aa无序,
- General sequence analysis tools
- UNIPROT (https://www.uniprot.org/): Information on sequence, functional annotation, tissue/ subcellular localization, and disease association.
- BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi): Identify homologs and orthologs.
- ProtParam (https://web.expasy.org/protparam): Calculate basic protein properties including molecular weight, pI, and amino acid composition; can be applied to domains.
- CIDER (http://pappulab.wustl.edu/CIDER/): Calculation of distribution and patterning of charged and hydrophobic residues to classify disordered sequences.
- Disorder predictors: We recommend using Meta-predictors, which integrate results from several individual predictors and screen for known folded domains to reduce the possibility of false positives or negatives.
- MobiDB (http://mobidb.bio.unipd.it/about): Combines annotations from external databases, indirect evidence from experimental data, and predictions to provide an overall picture of folded domains, disordered regions, secondary structure, and regions with low sequence complexity.
- D2P2 (http://d2p2.pro/): Database that aggregates predictions of disorder and binding sites and information on Pfam domains and PTMs.
- DisMeta (http://www-nmr.cabm.rutgers.edu/bioinformatics/disorder/): Meta-predictor of protein disorder.
- Phase-separation predictorsPi-Pi predictor (https://cdn.elifesciences.org/articles/31486/elife-31486-supp-v1.zip): Predicts the driving force of pi-pi contacts for phase separation in a given sequence.PLAAC (http://plaac.wi.mit.edu/): Predictor of prion-like domains.
- ZipperDB (https://services.mbi.ucla.edu/zipperdb/): Predicts fibril-forming segments in proteins, which have been argued to contribute to phase separation or can mediate maturation from liquid to solid states.
Mutation of interaction domain采取的方式:leave one out(截短体)点突变,mutation prevent/reduce LLPS (影响相变但不影响功能)
体外生化、细胞内判断的一些标准:droplets,spherical shapesaturation concentration (调整浓度,相变的过程变化,concentration dependence of LLPS)(和dimerization,oligomerization,higher-order self-association without phase separation不同)direct observation of fusion (但是有的 undergo liquid-to-solid transition,不融合)
离体观察的时候,避免承载物的影响可以更换成lipid、PEG(no experimentally induced gelation effects)浑浊程度、吸光度可以作为初步判断,Turbidity measurements通过离心的方面可以得到dense phase by centrifugation
- 一些体外表达的建议:
- 蛋白纯度、在大肠杆菌、酵母,昆虫细胞,或者体外翻译,BL21 strain一般可以,其他的表达系统也可以尝试;无规律区域容易被蛋白水解,所以需要加入蛋白酶抑制剂,另外得注意迅速操作,避免aggregation(MBP促融标签)。
- 可以优化形成inclusion bodies,包含体,一方面可以继续溶解,也可以不被酶解。
- Buffer得是生理条件buffer,变性buffer不行。组成:A typical buffer will contain a buffering component (e.g.pH缓冲体系 50 mM HEPES pH 7.5), a salt component (e.g., 盐离子 300 mM NaCl, 500 mM KCl, or even no salt), and a reducing agent (e.g., 还原剂 1 mM TCEP or 5 mM DTT). To determine whether phase separation occurs under physiological conditions, the salt concentration should be adjusted to 150 mM NaCl or KCl.
- Crowders(PEG,ficoll,葡聚糖,dextran,右旋糖苷会加速相变的形成,所以在纯化蛋白时要注意,另一方面,这种促进的机制还不清楚,1)可能增加了蛋白的有效浓度?模拟了胞质的浓度环境 2)溶液环境改变)小分子(ATP)也会影响,用没有特定生物功能的衍生物来研究小分子在相变过程中作用
测量相变体系的性质
在看荧光漂白恢复时,结果不仅仅代表droplet和胞质的交换速率,droplet的大小、droplet的可活动性、漂白区域的大小、位置也会对结果有影响。in live cells在体外做的时候可以随时控制到饱和浓度,形成相变,但是在细胞内,可能是在特定的时刻到达饱和浓度,形成相变体系的分子的饱和浓度的时间是错开的,所以需要注意。

Further reading
- The Functionally Important N-Terminal Half of Fission Yeast Mid1p Anillin Is Intrinsically Disordered and Undergoes Phase Separation
- Moon Chatterjee
- & Thomas D. Pollard
- Biochemistry (2019)
- Ciphers and Executioners: How 3′-Untranslated Regions Determine the Fate of Messenger RNAs
- Vinay K. Mayya
- & Thomas F. Duchaine
- Frontiers in Genetics (2019)
- Clustered telomeres in phase-separated nuclear condensates engage mitotic DNA synthesis through BLM and RAD52
- Jaewon Min
- , Woodring E. Wright
- & Jerry W. Shay
- Genes & Development (2019)
- Dynamic Recruitment of Single RNAs to Processing Bodies Depends on RNA Functionality
- Sethuramasundaram Pitchiaya
- , Marcio D.A. Mourao
- […]
- Nils G. Walter
- Molecular Cell (2019)
- The Long and the Short of the RNA Polymerase C-Terminal Domain and Phase Separation
- R. Stefan Isaac
- & L. Stirling Churchman
- Molecular Cell (2019)
Phase Separation in Biology and Disease这个地方有一些干货,可以结合自己的研究方向看。

https://www.nyas.org/events/2019/phase-separation-in-biology-and-disease/?tab=agenda
https://nyaspubs.onlinelibrary.wiley.com/toc/17496632/0/0
PPT链接: