Protein Secondary Sequence
ccPDB - Dataset for prediction protein secondary structure
@kaggle.tamzidhasan_protein_secondary_sequence
ccPDB - Dataset for prediction protein secondary structure
@kaggle.tamzidhasan_protein_secondary_sequence
unnamed_0Unnamed: 0 | pdb_idPdb Id | seqSeq | sst3Sst3 | sst8Sst8 |
---|---|---|---|---|
1a0gA | GYTLWNDQIVKDEEVKIDKEDRGYQFGDGVYEVVKVYNGEMFTVNEHIDRLYASAEKIRITIPYTKDKFHQLLHELVEKNELNTGHIYFQVTRGTSPRAHQFPENTVKPVIIGYTKENPRPLENLEKGVKATFVEDIRWLRCDIKSLNLLGAVLAKQEAHEKGCYEAILHRNNTVTEGSSSNVFGIKDGILYTHPANNMIAKGITRDVVIACANEINMPVKEIPFTTHEALKMDELFVTSTTSEITPVIEIDGKLIRDGKVGEWTRKLQKQFETKIPKPL | CEEEECCEEEEHHHCCECCCEHHHHHCCEEEEEEEEECCEECCHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHCCCCEEEEEEEECCECCCCCCCCCCCCCCEEEEEEEECCCCHHHHHHCEEEEEEECCCCCCCCCCECCCHHHHHHHHHHHHCCCCEEEEEECCEEEEECCCEEEEEECCEEECCCCCCCCCCCHHHHHHHHHHHHCCCCEECCCCEHHHHCCCCEEEEEECCCEEEEEEEECCEECCCCCCCHHHHHHHHHHHCCCCCCC | CEEEETTEEEEGGGCCBCTTBHHHHHCCEEEEEEEEETTEETTHHHHHHHHHHHHHHTTCCCSSCHHHHHHHHHHHHHHHTCSSEEEEEEEECCBCSSCSSCCCTTSCCEEEEEEEECCCCHHHHHHCEEEEEEECCCCSCTTSCBSCCHHHHHHHHHHHHTTCSEEEEEETTEEEEESSSEEEEEETTEEECCCSSTTSCCCHHHHHHHHHHHHTTCCEECCCCBHHHHTTCSEEEEEETTTEEEEEEEETTEESTTSSCCHHHHHHHHHHHTTSCCCC | |
1 | 1a27A | ARTVVLITGCSSGIGLHLAVRLASDPSQSFKVYATLRDLKTQGRLWEAARALACPPGSLETLQLDVRDSKSVAAARERVTEGRVDVLVCNAGLGLLGPLEALGEDAVASVLDVNVVGTVRMLQAFLPDMKRRGSGRVLVTGSVGGLMGLPFNDVYCASKFALEGLCESLAVLLLPFGVHLSLIECGPVHTAFMEKVLGSPEEVLDRTDIHTFHRFYQYLAHSKQVFREAAQNPEEVAEVFLTALRAPKPTLRYFTTERFLPLLRMRLDDPSGSNYVTAMHREVFG | CCEEEEECCCCCHHHHHHHHHHHCCCCCCEEEEEEECCHHHCHHHHHHHHHCCCCCCCEEEEECCCCCHHHHHHHHHCCCCCCCCEEEECCCCCCCCCHHHCCHHHHHHHHHHHCHHHHHHHHHHHHHHHHHCCEEEEEEEEHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCEEEEEEEECCECCCCCCCCCCCHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCECHHHHHHHHHHHHHCCCCCCEEECCCCCHHHHHCCCCCCCCHHHHHHHHHHHHC | CCEEEEESCCSSHHHHHHHHHHHTCTTCCEEEEEEESSGGGTHHHHHHHHHTTCCTTSEEEEECCTTCHHHHHHHHHTCTTSCCSEEEECCCCCCCSCGGGCCHHHHHHHHHHHTHHHHHHHHHHHHHHHHHTCEEEEEEEEGGGTSCCTTCHHHHHHHHHHHHHHHHHHHHHGGGTEEEEEEEECCBSSSTTTTSCCCHHHHHHHSCHHHHHHHHHHHHHHHHHHHHHCBCHHHHHHHHHHHHHCSSCCSEEESCSTTHHHHHTTTSSTTSHHHHHHHHHHHHC |
2 | 1a34A | TGDNSNVVTMIRAGSYPKVNPTPTWVRAIPFEVSVQSGIAFKVPVGSLFSANFRTDSFTSVTVMSVRAWTQLTPPVNEYSFVRLKPLFKTGDSTEEFEGRASNINTRASVGYRIPTNLRQNTVAADNVCEVRSNCRQVALVISCCFN | CCCCCCCCCCCCCCCCCCCCCCCCEEEEEEEEEECCCCCCEEEEHHHHCCHHHCCCCCCCEEEEEEEEEECCCCCCCCCCEEEEEECCCCCCCCCCEEEECCCCCCCCEEEEECCHHHCCCECCCCEEEEEEECCCEEEEEEEEEEC | CCCSCCSCCCCCCCSCCCCCSSCCEEEEEEEEEECCTTCCEEEEGGGGCCGGGTCTTCSCEEEEEEEEEECSCCSTTCCCEEEEEECCTTCCCCCCEEEECSSTTSCCEEEEECCGGGCCCBCTTSEEEEEEESSSEEEEEEEEEEC |
3 | 1a3aA | LFKLGAENIFLGRKAATKEEAIRFAGEQLVKGGYVEPEYVQAMLDREKLTPTYLGESIAVPHGTVEAKDRVLKTGVVFCQYPEGVRFGEEEDDIARLVIGIAARNNEHIQVITSLTNALDDESVIERLAHTTSVDEVLELLAGRK | CCCCCHHHEECCCCCCCHHHHHHHHHHHHHHCCCECCHHHHHHHHHHHHCCCEEECCEECCECCHHHHHHECCCEEEEEEEEEEEECCCCCCCEEEEEEEEECCCCCHHHHHHHHHHHCCCHHHHHHHHHCCCHHHHHHHCCCCC | CCCCCGGGEECSCCCSSHHHHHHHHHHHHHHTTSBCTHHHHHHHHHHHHSCCEEETTEECCBCCGGGGGGBSSCEEEEEEEEEEEECSSSTTCEEEEEEEEECSTTTHHHHHHHHHHHTCSHHHHHHHHHCCCHHHHHHHTTTCC |
4 | 1a3cA | QKAVILDEQAIRRALTRIAHEMIERNKCILVGIKTRGIYLAKRLAERIEQIEGNPVTVGEIDITLYRNDEPLVKGADIPVDITDQKVILVDDVLYTGRTVRAGMDALVDVGRPSSIQLAVLVDRGHRELPIRADYIGKNIPTSKSEKVMVQLDEVDQNDLVAIYEN | CEEEEECHHHHHHHHHHHHHHHHHHCCCEEEEECHHHHHHHHHHHHHHHHHHCCCCEEEEEEEECCCCCCCEEEEEECCCCCCCCEEEEEEEEECCCHHHHHHHHHHHHHCCCCEEEEEEEEECCCCCCCCCCCEEEEECCCCCCCEEEEECHHHHCCCEEEEECC | CEEEEECHHHHHHHHHHHHHHHHHHCCCEEEEESHHHHHHHHHHHHHHHHHHSSCCEEEEEEEECCCCCCCEEEEEECSSCCTTSEEEEEEEEESSSHHHHHHHHHHHHHCCCSEEEEEEEEECCCCSSSCCCSEEEEECCCCSSCEEEEECHHHHSSCEEEEECC |
5 | 1a3zA | TWKEATLPQVKAMLEKDDGKVSGDTVTYSGKTVHVVAAAVLPGFPFPSFEVHDKKNPTLEIPAGATVDVTFINTNKGFGHSFDITKKGPPYAVMPVIDPIVAGTGFSPVPKDGKFGYTDFTWHPTAGTYYYVCQIPGHAATGMFGKIVVK | CCEEECHHHHHHHHCCCCCEEECCEEECCCCEEEEEEEECCCCCCCCCEEECCEECCEEEECCCCEEEEEEEECCCCCCCCCEEECCCCCCCCCCCCCCCCEECCCCCCCECCEEEEEEEEECCCCEEEEEECCCCCCHHHCCEEEEEEC | CCEEECHHHHHHHHTTCCCEEETTEEECCSSEEEEEEEESCTTSCSSCEEETTEESCEEEECTTCEEEEEEEECCTTCCCCCEEESCCSCCCSSCCCCSCSEECCCCCCCBTTBEEEEEEEECCCSEEEEEECCSTTTGGGTCEEEEEEC |
6 | 1a40A | EASLTGAGATFPAPVYAKWADTYQKETGNKVNYQGIGSSGGVKQIIANTVDFGASDAPLSDEKLAQEGLFQFPTVIGGVVLAVNIPGLKSGELVLDGKTLGDIYLGKIKKWDDEAIAKLNPGLKLPSQNIAVVRRADGSGTSFVFTSYLAKVNEEWKNNVGTGSTVKWPIGLGGKGNDGIAAFVQRLPGAIGYVEYWYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWSKTFAQDLTNQKGEDAWPITSTTFILIHKDQKKPEQGTEVLKFFDWAYKTGAKQANDLDYASLPDSV… | CCEEEEEECCCCHHHHHHHHHHHHHHHCCEEEEEECCHHHHHHHHHCCCCCEEEECCCCCHHHHHHHCEEEEEEEEEEEEEEECCCCCCCCCCEECHHHHHHHHHCCCCECCCHHHHHHCCCCCCCCCECEEEEECCCCHHHHHHHHHHHHHCHHHHHHCCCCCCCCCCCCEEECHHHHHHHHHHHCCCEEEEEEHHHHHCCCCEECEEECCCCCEECCCHHHHHHHCCCCCCCCCCCCCCECCCCCCCCCEEEEEEEEEECEECCHHHHHHHHHHHHHHHHHCHHHHHHCCCEECCHHH… | CCEEEEEECSTTHHHHHHHHHHHHHHHCCEEEEEECCHHHHHHHHHTTSSSEEEESSCCCHHHHHHHTEEEEEEEEEEEEEEECCTTCCTTTCEECHHHHHHHHHTCCCBTTCHHHHHHSTTCCCCCCBCEEEEESSCCHHHHHHHHHHHHHCHHHHHHTCCSSSCCCSSCEEESHHHHHHHHHHHSTTEEEEEEHHHHHTTTCEECEEECTTSCEECCCHHHHHHHTTTCCTTTCSCCCCBSCCSTTCCSBEEEEEEEEESEESSHHHHHHHHHHHHHHHHHCHHHHHHTTCEECCHHH… |
7 | 1a48A | SITKTELDGILPLVARGKVRDIYEVDAGTLLFVATDRISAYDVIMENSIPEKGILLTKLSEFWFKFLSNDVRNHLVDIAPGKTIFDYLPAKLSEPKYKTQLEDRSLLVHKHKLIPLEVIVRGYITGSAWKEYVKTGTVHGLKQPQGLKESQEFPEPIFTPSTDENISPAQAAELVGEDLSRRVAELAVKLYSKCKDYAKEKGIIIADTKFEFGIDEKTNEIILVDEVLTPDSSRFWNGASYKVGESQDSYDKQFLRDWLTANKLNGVNGVKMPQDIVDRTRAKYIEAYETLTGSKWSH | CCCCCCCCCCCCEEEECCCEEEEEEECCEEEEEECCCCEECCEECCCCCCCHHHHHHHHHHHHHHHCCCCCEECECCCCCCCCHHHHCCHHHHCHHHHHHHCCCEEEEECCEECCCEEEEEEECCHHHHHHHHHHCEECCEECCCCCCCCCEEEEEEECCECCCECCHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEEEECEEEECCCCEEEECCCCCCCCCEEEEECCCCCCCCCCCCCCCHHHHHHHHHCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCC | CCSSCCCTTSSCEEEECSSEEEEEEETTEEEEEECSCCEETTEECSSCCTTHHHHHHHHHHHHHHHTTTTCEECBCCCCTTCCGGGGSCGGGGSHHHHHHHTTSEEEEECCEECCSBEEEEEECCHHHHHHHHHHSEETTEECCSCCCTTCEEEEEEECCBCCCBCCHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHTTEEEEEEEECEEEETTTTEEEECSCCSCTTTEEEEESTTCCTTSCCCCTTTHHHHHHHHHTTCTTCSSCCCCHHHHHHHHHHHHHHHHHHHCCCCCC |
8 | 1a62A | XNLTELKNTPVSELITLGENXGLENLARXRKQDIIFAILKQHAKSGEDIFGDGVLEILQDGFGFLRSADSSYLAGPDDIYVSPSQIRRFNLRTGDTISGKIRPPKEGERYFALLKVNEVNFDKPE | CEHHHHHCCCHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHCCCCEEEEEEEEECCCCCEEEECHHHCCCCCCCCEEECHHHHHHCCCCCCCEEEEEEECCCCCCCCEEEEEEEEECCECCC | CBHHHHHTSCHHHHHHHHHTTTCCCCTTSCHHHHHHHHHHHHHHTTCCEEEEEEEEECTTSCEEEECGGGTTCCCTTCEEECHHHHHHTTCCTTCEEEEEEECCCTTCCSEEEEEEEEETTBCCC |
9 | 1a73A | ALTNAQILAVIDSWEETVGQFPVITHHVPLGGGLQGTLHCYEIPLAAPYGVGFAKNGPTRWQYKRTINQVVHRWGSHTVPFLLEPDNINGKTCTASHLCHNTRCHNPLHLCWESLDDNKGRNWCPGPNGGCVHAVVCLRQGPLYGPGATVAGPQQRGSHFVV | CCCHHHHHHHHHHHHHHHCCCCEEEEEEEEECCEEEEEEEEECCCCCCCCCCEEEEECCEEEEEEEECCEEEEEECCCHHHCCCCCEECCEEEEEEECCCCCCECCHHHEEEEEHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCECCCCCCCCCCC | CCCHHHHHHHHHHHHHHHTTSCEEEEEEEEETTEEEEEEEEBCCSSSCCSTTEEEEETTEEEEEEEETTEEEEEETTTGGGTTSCSEETTEEEEEEETTCCTTBCCGGGEEEEEHHHHHHGGGCCCTTTTCCCSSCCSSCCTTCSSCCCSBCSCCSSSSCCC |
CREATE TABLE pdb_31_12_2012 (
"unnamed_0" BIGINT,
"pdb_id" VARCHAR,
"seq" VARCHAR,
"sst3" VARCHAR,
"sst8" VARCHAR
);
Anyone who has the link will be able to view this.