Protein Secondary Sequence
ccPDB - Dataset for prediction protein secondary structure
@kaggle.tamzidhasan_protein_secondary_sequence
ccPDB - Dataset for prediction protein secondary structure
@kaggle.tamzidhasan_protein_secondary_sequence
unnamed_0Unnamed: 0 | pdb_idPdb Id | seqSeq | sst3Sst3 | sst8Sst8 |
---|---|---|---|---|
12asA | AYIAKQRQISFVKSHFSRQLEERLGLIEVQAPILSRVGDGTQDNLSGAEKAVQVKVKALPDAQFEVVHSLAKWKRQTLGQHDFSAGEGLYTHMKALRPDEDRLSPLHSVYVDQWDWERVMGDGERQFSTLKSTVEAIWAGIKATEAAVSEEFGLAPFLPDQIHFVHSQELLSRYPDLDAKGRERAIAKDLGAVFLVGIGGKLSDGHRHDVRAPDYDDWSTPSELGHAGLNGDILVWNPVLEDAFELSSMGIRVDADTLKHQLALTGDEDRLELEWHQALLRGEMPQTIGGGIGQSRLTML… | CHHHHHHHHHHHHHHHHHHHHHHHCEEECCCCCEEECCCCCCCCCCCCCCCCEECCCCCCCCCEEECCCCCCHHHHHHHHCCCCCCCEEEEEEEEECCCCCCCCCCCCCEEEEEEEEEECCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCEEEEHHHHHHHCCCCCHHHHHHHHHHHHCEEEEECCCCCCCCCCCCCCCCCCCECCCCECCCCCECCEEEEEEEECCCCEEEEEEEEEEECCHHHHHHHHHHHCCCCHHHCHHHHHHHCCCCCCEEEEEEEHHHHHHH… | CHHHHHHHHHHHHHHHHHHHHHHHCEEECCCCSEEETTSSCSCCTTTTCCCCEECCSSSTTCCEEECSCCTTHHHHHHHHTTCCTTCEEEEEEEEECTTCSCCCSSCCSEEEEEEEEEECCTTCCSHHHHHHHHHHHHHHHHHHHHHHHHHSCCCCCSCSSCEEEEHHHHHHHSSSSCHHHHHHHHHHHHSEEEEECCSSCCSSSCCSSCCCTTTBCCSSBCTTSSBCSEEEEEEEETTTTEEEEEEEEEEBCCHHHHHHHHHHHTCTTGGGSHHHHHHHTTCSCCEEEEEEEHHHHHHH… | |
1 | 16vpA | SRMPSPPMPVPPAALFNRLLDDLGFSAGPALCTMLDTWNEDLFSALPTNADLYRECKFLSTLPSDVVEWGDAYVPERTQIDIRAHGDVAFPTLPATRDGLGLYYEALSRFFHAELRAREESYRTVLANFCSALYRYLRASVRQLHRQAHMRGRDRDLGEMLRATIADRYYRETARLARVLFLHLYLFLTREILWAAYAEQMMRPDLFDCLCCDLESWRQLAGLFQPFMFVNGALTVRGVPIEARRLRELNHIREHLNLPLVRSAATEEPGAPLTTPPTLHGNQARASGYFMVLIRAKLDS… | CCCCCCCCCCCHHHHHHHHHHHHCCCCHHHHHHHHHHCCCCCCCCCCCCHHHHCCCHHHCCCHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHCCEEEEECCCHHHHCCCCCCCECCCEEEECCEECCHHHHHHHHHHHHHCCCCCCECCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHCC… | CCSCCCCCCCCHHHHHHHHHHHHTCTTHHHHHHHHHHCCCCCSTTSCCCGGGGTTCGGGCSCHHHHHHHHHHCCCCCSSCCTTCCCSSCCCCCCSSGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHTTCCCCHHHHHHHHIIIIIHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHTCHHHHTTEEEEESCSHHHHSSCCSCSBCCSEEEETTEECCHHHHHHHHHHHHHTTCCCCBCTTTSCTTSCSCCCCCCCTTSCCHHHHHHHHHHHHHTS… |
2 | 1914A | MVLLESEQFLTELTRLFQKCRSSGSVFITLKKYDEGLEPAENKCLLRATDGKRKISTVVSSKEVNKFQMAYSNLLRANMDGLKKRAQGGEQKLFQTWEEFSRAAEKLYLADPMKVRVVLKYRHVDGNLCIKVTDDLVCLVYRTDQAQDVKKIEKFHSQLMRLMVAKESRNV | CCEECHHHHHHHHHHHHHHCCCCCCEEEEEEEECCCCCCCCCEEEEEEECCCCEEEEEEECCCHHHHHHHHHHHHHHHCCCCECCCCEEEEECCCCHHHHHHHHHHHHHHCCCCCEEEEEEECCCCEEEEEEECCCCEEEEEECEHHHHHHHHHHHHHHHHHHHCCCCCCC | CCEECHHHHHHHHHHHHHHTSSSCCEEEEEEEECCCCCCCCCEEEEEEESSSCEEEEEEETTSHHHHHHHHHHHHHHHSCCSBCCCCEEEEECCCSHHHHHHHHHHHHHHCTTTCEEEEEEETTTTEEEEEEECSSSEEEEEECBGGGHHHHHHHHHHHHHHHHCCCCCCC |
3 | 1a0iA | VNIKTNPFKAVSFVESAIKKALDNAGYLIAEIKYDGVRGNICVDNTANSYWLSRVSKTIPALEHLNGFDVRWKRLLNDDRCFYKDGFMLDGELMVKGVDFNTGSGLLRTKWTDTKNQEFHRKKDKVPFKLHTGHLHIKLYAILPLHIVESGEDCDVMTLLMQEHVKNMLPLLQEYFPEIEWQAAESYEVYDMVELQQLYEQKRAEGHEGLIVKDPMCIYKRGKKSGWWKMKPENEADGIIQGLVWGTKGLANEGKVIGFEVLLESGRLVNATNISRALMDEFTETVKEATLSQWGFFDAC… | CCCCCCCEEEEECCHHHHHHHHHHHCCEEEEECCCCEEEEEEEECCCEEEEECCCCCECHHHHHHCEECHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCCHHHHHHCCCCCCCECCCCCCCCCCCCCECCCCEEEEEEEEEEHHHHHHCCCEEEEHHHHHHHHHHHHHHHHHHCCCCEEEECCEEEECCHHHHHHHHHHHHCCCCCCEEEECCCCEECCEEEEEEEEECCCEEEEEEEEEEECCCCCCCCCCCCCEEEEECCCCCEEEEECCCCHHHHHHHHHHHHHHCCCCCCCCCC… | CTTCCCCEEEEECCHHHHHHHHHHHSSEEEEECCCSEEEEEEEETTSEEEEECTTSCBCGGGGGGCEECHHHHHHHHSTTCCCTTEEEEEEEEEESSSCTTTHHHHHHCCSCCSSBSSCCCCCSCCCCCBCTTTEEEEEEEEEEHHHHHHCCCEEEEHHHHHHHHHHHHHHHHHHCTTSEEEECCEEEESSHHHHHHHHHHHHTTTCCCEEEECTTCEECSEEEEEEEEESCCEEEEEEEEEEECCCTTTSSCSSCCEEEEECTTSCEEEEBCCCSHHHHHHHHHHHHHHTTTSCCCCCC… |
4 | 1a0pA | QDLARIEQFLDALWLEKNLAENTLNAYRRDLSMMVEWLHHRGLTLATAQSDDLQALLAERLSSARLLSAVRRLFQYLYREKFREDDPSAHLKDLSEAQVERLLQAPLIDQPLELRDKAMLEVLYATGLRVSELVGLTMSDISLRQGVVRVIGKGNKERLVPLGEEAVYWLETYLEHGRPWLLNGVSIDVLFPSQRAQQMTRQTFWHRIKHYAVLAGIDSEKLSPHVLRHAFATHLLNHGADLRVVQMLLSDLSTTQIYTHVATERLRQLHQ | CHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHCCCHHHHCCCEHHHEECCCCEEEEECCCCCEEEEECCHHHHHHHHHHHHHCHHHHHCCCCCCECCECCCCCECCHHHHHHHHHHHHHHCCCCHHHCCHHHHHHHHHHHHHHHCCCCHHHCCCCCCCCHHHHHHHHHHHHHHHHHC | CHHHHHHHHHHHHHHTTCSCHHHHHHHHHHHHHHHHHHHHTSCCTTTCCHHHHHHHHHSCCCHHHHHHHHHHHHHHHHHTTSSSSCTTSCCCCCCHHHHHHHHHCSCTTSHHHHHHHHHHHHHHHHCCCHHHHTTCBGGGEETTTTEEEEECSSSCEEEEECCHHHHHHHHHHHHHTHHHHHTTCCCCBSSBCTTSSBCCHHHHHHHHHHHHHHTTCCGGGCCHHHHHHHHHHHHHHHCSSCGGGSSCCCCCCHHHHHHHHHHHHHHHHHC |
5 | 1a0rP | FEGQASHTGPKGVINDWRKFKLESEFSRKMSVQEYELIHKDKEDENCLRKYRRQCMQDMHQKLSFGPRYGFVYELESGEQFLETIEKEQKITTIVVHIYEDGIKGCDALNSSLICLAAEYPMVKFCKIKASNTGAGDRFSSDVLPTLLVYKGGELLSNFISVTEQLAEEFFTGDVESFLNEYGLLPEK | CCCCCCCCHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCCCCEEECCCHHHHHHHHHCCCCCCEEEEEEECCCCCCHHHHHHHHHHHHHHCCCCEEEEEEHHHHCCCCCCCCCCCCEEEEEECCEEEEEECCHHHHCCCCCCHHHHHHHHHCCCCCCCC | CCSSCCSSHHHHHHHHHHHHHHHTCCCCCSCHHHHHHHTTCCCCHHHHHHHHHHHHHHHHHHHCCCCCCCSEEECCSHHHHHHHHHSSCTTCEEEEEEECTTSTTHHHHHHHHHHHHHHCTTSEEEEEEHHHHCCTTSSCTTTCSEEEEEETTEEEEEETTGGGGSCTTCCHHHHHHHHHTTTCSCCC |
6 | 1a12A | KKVKVSHRSHSTEPGLVLTLGQGDVGQLGLGENVMERKKPALVSIPEDVVQAEAGGMHTVCLSKSGQVYSFGCNDEGALGRDTSVEGSEMVPGKVELQEKVVQVSAGDSHTAALTDDGRVFLWGSFRDNNGVIGLLEPMKKSMVPVQVQLDVPVVKVASGNDHLVMLTADGDLYTLGCGEQGQLGRVPELFANRGGRQGLERLLVPKCVMLKSRGSRGHVRFQDAFCGAYFTFAISHEGHVYGFGLSNYHQLGTPGTESCFIPQNLTSFKNSTKSWVGFSGGQHHTVCMDSEGKAYSLGR… | CCCCCCCCCCCCCCEEEEEEEECCCCCCCCCCCCCEEEEEEEECCCCCEEEEEECCCEEEEEECCCCEEEEECCCCCCCCCCCCCCCHHHCCEECCCCCCEEEEEECCCEEEEEECCCCEEEEECEEECCEEEECCEECECEEEEEEECCCCCEEEEEECCCEEEEEECCCCEEEEECCCCCCCCCCHHHCCCCCHHHHHHHHHCCEECCCECCCCCCECCEEEEEEECCEEEEEECCCCEEEEECCCCCCCCCCCCCCEEEEEECHHHCCCCCCEEEEEECCCEEEEEECCCCEEEEEC… | CCCCCCCTTCCCCCBEEEEEEECTTSTTCSCTTCCEEEEEEEECCSSCEEEEEECSSEEEEEETTSCEEEEECCTTSTTCSCCCSTTGGGSCEECCCCSCEEEEEECSSEEEEEETTSCEEEEECEEETTEEEESSBBTBCEEEEEEECCSSCEEEEEECSSEEEEEETTSCEEEEECCTTSTTCSCGGGTSSSCGGGGHHHHHSCEECCCBCSSCCSBCCEEEEEEETTEEEEEETTCCEEEEECCTTSTTSCSSCSCEEEEEECGGGCCTTCCEEEEEECSSEEEEEETTSCEEEEEC… |
7 | 1a17A | PPADGALKRAEELKTQANDYFKAKDYENAIKFYSQAIELNPSNAIYYGNRSLAYLRTECYGYALGDATRAIELDKKYIKGYYRRAASNMALGKFRAALRDYETVVKVKPHDKDAKMKYQECNKIVKQKAFERAIAGDEHKRSVVDSLDIESMTIEDEYS | CCCHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCCC | CCCHHHHHHHHHHHHHHHHHHHTTCHHHHHHHHHHHHHHSTTCHHHHHHHHHHHHHTTCHHHHHHHHHHHHHHCTTCHHHHHHHHHHHHHTTCHHHHHHHHHHHHHHSTTCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCTTCCCCCSCC |
8 | 1a1xA | AGEDVGAPPDHLWVHQEGIYRDEYQRTWVAVVEEETSFLRARVQQIQVPLGDAARPSHLLTSQLPLMWQLYPEERYMDNNSRLWQIQHHLMVRGVQELLLKLLPDD | CCCCCCCCCCEEEEEECCEEEECCCCEEEEEEEECCCCEEEEEECCCCCCCCCCCHHHHCCCCCCCEEEEECCCEEEECCCCEEEEEEEEEECCEEEEEEEECCCC | CCCCCCCCCSEEEEEETTEEEETTSCEEEEEEEECSSCEEEEEECCCCCCCSCCCHHHHTTCSSCSEEEEETTTEEEETTSCEEEEEEEEEETTEEEEEEEECCCC |
9 | 1a27A | ARTVVLITGCSSGIGLHLAVRLASDPSQSFKVYATLRDLKTQGRLWEAARALACPPGSLETLQLDVRDSKSVAAARERVTEGRVDVLVCNAGLGLLGPLEALGEDAVASVLDVNVVGTVRMLQAFLPDMKRRGSGRVLVTGSVGGLMGLPFNDVYCASKFALEGLCESLAVLLLPFGVHLSLIECGPVHTAFMEKVLGSPEEVLDRTDIHTFHRFYQYLAHSKQVFREAAQNPEEVAEVFLTALRAPKPTLRYFTTERFLPLLRMRLDDPSGSNYVTAMHREVFG | CCEEEEECCCCCHHHHHHHHHHHCCCCCCEEEEEEECCHHHCHHHHHHHHHCCCCCCCEEEEECCCCCHHHHHHHHHCCCCCCCCEEEECCCCCCCCCHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEEEEHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCEEEEEEEECCECCCCCCCCCCCHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCECHHHHHHHHHHHHHCCCCCCEEECCCCCHHHHHCCCCCCCCHHHHHHHHHHHHC | CCEEEEESCCSSHHHHHHHHHHHTCTTCCEEEEEEESSGGGTHHHHHHHHHTTCCTTSEEEEECCTTCHHHHHHHHHTCTTSCCSEEEECCCCCCCSCGGGCCHHHHHHHIIIIIIHHHHHHHHHHHHHHHHTCEEEEEEEEGGGTSCCTTCHHHHHHHHHHHHHHHHHHHHHGGGTEEEEEEEECCBSSSTTTTSCCCHHHHHHHSCHHHHHHHHHHHHHHHHHHHHHCBCHHHHHHHHHHHHHCSSCCSEEESCSTTHHHHHTTTSSTTSHHHHHHHHHHHHC |
CREATE TABLE pdb_31_07_2011 (
"unnamed_0" BIGINT,
"pdb_id" VARCHAR,
"seq" VARCHAR,
"sst3" VARCHAR,
"sst8" VARCHAR
);
Anyone who has the link will be able to view this.