Baselight

Protein Secondary Sequence

ccPDB - Dataset for prediction protein secondary structure

@kaggle.tamzidhasan_protein_secondary_sequence

Pdb 31–07–2011
@kaggle.tamzidhasan_protein_secondary_sequence.pdb_31_07_2011

  • 7.84 MB
  • 17608 rows
  • 5 columns
unnamed_0

Unnamed: 0

pdb_id

Pdb Id

seq

Seq

sst3

Sst3

sst8

Sst8

12asAAYIAKQRQISFVKSHFSRQLEERLGLIEVQAPILSRVGDGTQDNLSGAEKAVQVKVKALPDAQFEVVHSLAKWKRQTLGQHDFSAGEGLYTHMKALRPDEDRLSPLHSVYVDQWDWERVMGDGERQFSTLKSTVEAIWAGIKATEAAVSEEFGLAPFLPDQIHFVHSQELLSRYPDLDAKGRERAIAKDLGAVFLVGIGGKLSDGHRHDVRAPDYDDWSTPSELGHAGLNGDILVWNPVLEDAFELSSMGIRVDADTLKHQLALTGDEDRLELEWHQALLRGEMPQTIGGGIGQSRLTML…CHHHHHHHHHHHHHHHHHHHHHHHCEEECCCCCEEECCCCCCCCCCCCCCCCEECCCCCCCCCEEECCCCCCHHHHHHHHCCCCCCCEEEEEEEEECCCCCCCCCCCCCEEEEEEEEEECCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCEEEEHHHHHHHCCCCCHHHHHHHHHHHHCEEEEECCCCCCCCCCCCCCCCCCCECCCCECCCCCECCEEEEEEEECCCCEEEEEEEEEEECCHHHHHHHHHHHCCCCHHHCHHHHHHHCCCCCCEEEEEEEHHHHHHH…CHHHHHHHHHHHHHHHHHHHHHHHCEEECCCCSEEETTSSCSCCTTTTCCCCEECCSSSTTCCEEECSCCTTHHHHHHHHTTCCTTCEEEEEEEEECTTCSCCCSSCCSEEEEEEEEEECCTTCCSHHHHHHHHHHHHHHHHHHHHHHHHHSCCCCCSCSSCEEEEHHHHHHHSSSSCHHHHHHHHHHHHSEEEEECCSSCCSSSCCSSCCCTTTBCCSSBCTTSSBCSEEEEEEEETTTTEEEEEEEEEEBCCHHHHHHHHHHHTCTTGGGSHHHHHHHTTCSCCEEEEEEEHHHHHHH…
116vpASRMPSPPMPVPPAALFNRLLDDLGFSAGPALCTMLDTWNEDLFSALPTNADLYRECKFLSTLPSDVVEWGDAYVPERTQIDIRAHGDVAFPTLPATRDGLGLYYEALSRFFHAELRAREESYRTVLANFCSALYRYLRASVRQLHRQAHMRGRDRDLGEMLRATIADRYYRETARLARVLFLHLYLFLTREILWAAYAEQMMRPDLFDCLCCDLESWRQLAGLFQPFMFVNGALTVRGVPIEARRLRELNHIREHLNLPLVRSAATEEPGAPLTTPPTLHGNQARASGYFMVLIRAKLDS…CCCCCCCCCCCHHHHHHHHHHHHCCCCHHHHHHHHHHCCCCCCCCCCCCHHHHCCCHHHCCCHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHCCEEEEECCCHHHHCCCCCCCECCCEEEECCEECCHHHHHHHHHHHHHCCCCCCECCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHCC…CCSCCCCCCCCHHHHHHHHHHHHTCTTHHHHHHHHHHCCCCCSTTSCCCGGGGTTCGGGCSCHHHHHHHHHHCCCCCSSCCTTCCCSSCCCCCCSSGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHTTCCCCHHHHHHHHIIIIIHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHTCHHHHTTEEEEESCSHHHHSSCCSCSBCCSEEEETTEECCHHHHHHHHHHHHHTTCCCCBCTTTSCTTSCSCCCCCCCTTSCCHHHHHHHHHHHHHTS…
21914AMVLLESEQFLTELTRLFQKCRSSGSVFITLKKYDEGLEPAENKCLLRATDGKRKISTVVSSKEVNKFQMAYSNLLRANMDGLKKRAQGGEQKLFQTWEEFSRAAEKLYLADPMKVRVVLKYRHVDGNLCIKVTDDLVCLVYRTDQAQDVKKIEKFHSQLMRLMVAKESRNVCCEECHHHHHHHHHHHHHHCCCCCCEEEEEEEECCCCCCCCCEEEEEEECCCCEEEEEEECCCHHHHHHHHHHHHHHHCCCCECCCCEEEEECCCCHHHHHHHHHHHHHHCCCCCEEEEEEECCCCEEEEEEECCCCEEEEEECEHHHHHHHHHHHHHHHHHHHCCCCCCCCCEECHHHHHHHHHHHHHHTSSSCCEEEEEEEECCCCCCCCCEEEEEEESSSCEEEEEEETTSHHHHHHHHHHHHHHHSCCSBCCCCEEEEECCCSHHHHHHHHHHHHHHCTTTCEEEEEEETTTTEEEEEEECSSSEEEEEECBGGGHHHHHHHHHHHHHHHHCCCCCCC
31a0iAVNIKTNPFKAVSFVESAIKKALDNAGYLIAEIKYDGVRGNICVDNTANSYWLSRVSKTIPALEHLNGFDVRWKRLLNDDRCFYKDGFMLDGELMVKGVDFNTGSGLLRTKWTDTKNQEFHRKKDKVPFKLHTGHLHIKLYAILPLHIVESGEDCDVMTLLMQEHVKNMLPLLQEYFPEIEWQAAESYEVYDMVELQQLYEQKRAEGHEGLIVKDPMCIYKRGKKSGWWKMKPENEADGIIQGLVWGTKGLANEGKVIGFEVLLESGRLVNATNISRALMDEFTETVKEATLSQWGFFDAC…CCCCCCCEEEEECCHHHHHHHHHHHCCEEEEECCCCEEEEEEEECCCEEEEECCCCCECHHHHHHCEECHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCCHHHHHHCCCCCCCECCCCCCCCCCCCCECCCCEEEEEEEEEEHHHHHHCCCEEEEHHHHHHHHHHHHHHHHHHCCCCEEEECCEEEECCHHHHHHHHHHHHCCCCCCEEEECCCCEECCEEEEEEEEECCCEEEEEEEEEEECCCCCCCCCCCCCEEEEECCCCCEEEEECCCCHHHHHHHHHHHHHHCCCCCCCCCC…CTTCCCCEEEEECCHHHHHHHHHHHSSEEEEECCCSEEEEEEEETTSEEEEECTTSCBCGGGGGGCEECHHHHHHHHSTTCCCTTEEEEEEEEEESSSCTTTHHHHHHCCSCCSSBSSCCCCCSCCCCCBCTTTEEEEEEEEEEHHHHHHCCCEEEEHHHHHHHHHHHHHHHHHHCTTSEEEECCEEEESSHHHHHHHHHHHHTTTCCCEEEECTTCEECSEEEEEEEEESCCEEEEEEEEEEECCCTTTSSCSSCCEEEEECTTSCEEEEBCCCSHHHHHHHHHHHHHHTTTSCCCCCC…
41a0pAQDLARIEQFLDALWLEKNLAENTLNAYRRDLSMMVEWLHHRGLTLATAQSDDLQALLAERLSSARLLSAVRRLFQYLYREKFREDDPSAHLKDLSEAQVERLLQAPLIDQPLELRDKAMLEVLYATGLRVSELVGLTMSDISLRQGVVRVIGKGNKERLVPLGEEAVYWLETYLEHGRPWLLNGVSIDVLFPSQRAQQMTRQTFWHRIKHYAVLAGIDSEKLSPHVLRHAFATHLLNHGADLRVVQMLLSDLSTTQIYTHVATERLRQLHQCHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHCCCHHHHCCCEHHHEECCCCEEEEECCCCCEEEEECCHHHHHHHHHHHHHCHHHHHCCCCCCECCECCCCCECCHHHHHHHHHHHHHHCCCCHHHCCHHHHHHHHHHHHHHHCCCCHHHCCCCCCCCHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHTTCSCHHHHHHHHHHHHHHHHHHHHTSCCTTTCCHHHHHHHHHSCCCHHHHHHHHHHHHHHHHHTTSSSSCTTSCCCCCCHHHHHHHHHCSCTTSHHHHHHHHHHHHHHHHCCCHHHHTTCBGGGEETTTTEEEEECSSSCEEEEECCHHHHHHHHHHHHHTHHHHHTTCCCCBSSBCTTSSBCCHHHHHHHHHHHHHHTTCCGGGCCHHHHHHHHHHHHHHHCSSCGGGSSCCCCCCHHHHHHHHHHHHHHHHHC
51a0rPFEGQASHTGPKGVINDWRKFKLESEFSRKMSVQEYELIHKDKEDENCLRKYRRQCMQDMHQKLSFGPRYGFVYELESGEQFLETIEKEQKITTIVVHIYEDGIKGCDALNSSLICLAAEYPMVKFCKIKASNTGAGDRFSSDVLPTLLVYKGGELLSNFISVTEQLAEEFFTGDVESFLNEYGLLPEKCCCCCCCCHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCCCCEEECCCHHHHHHHHHCCCCCCEEEEEEECCCCCCHHHHHHHHHHHHHHCCCCEEEEEEHHHHCCCCCCCCCCCCEEEEEECCEEEEEECCHHHHCCCCCCHHHHHHHHHCCCCCCCCCCSSCCSSHHHHHHHHHHHHHHHTCCCCCSCHHHHHHHTTCCCCHHHHHHHHHHHHHHHHHHHCCCCCCCSEEECCSHHHHHHHHHSSCTTCEEEEEEECTTSTTHHHHHHHHHHHHHHCTTSEEEEEEHHHHCCTTSSCTTTCSEEEEEETTEEEEEETTGGGGSCTTCCHHHHHHHHHTTTCSCCC
61a12AKKVKVSHRSHSTEPGLVLTLGQGDVGQLGLGENVMERKKPALVSIPEDVVQAEAGGMHTVCLSKSGQVYSFGCNDEGALGRDTSVEGSEMVPGKVELQEKVVQVSAGDSHTAALTDDGRVFLWGSFRDNNGVIGLLEPMKKSMVPVQVQLDVPVVKVASGNDHLVMLTADGDLYTLGCGEQGQLGRVPELFANRGGRQGLERLLVPKCVMLKSRGSRGHVRFQDAFCGAYFTFAISHEGHVYGFGLSNYHQLGTPGTESCFIPQNLTSFKNSTKSWVGFSGGQHHTVCMDSEGKAYSLGR…CCCCCCCCCCCCCCEEEEEEEECCCCCCCCCCCCCEEEEEEEECCCCCEEEEEECCCEEEEEECCCCEEEEECCCCCCCCCCCCCCCHHHCCEECCCCCCEEEEEECCCEEEEEECCCCEEEEECEEECCEEEECCEECECEEEEEEECCCCCEEEEEECCCEEEEEECCCCEEEEECCCCCCCCCCHHHCCCCCHHHHHHHHHCCEECCCECCCCCCECCEEEEEEECCEEEEEECCCCEEEEECCCCCCCCCCCCCCEEEEEECHHHCCCCCCEEEEEECCCEEEEEECCCCEEEEEC…CCCCCCCTTCCCCCBEEEEEEECTTSTTCSCTTCCEEEEEEEECCSSCEEEEEECSSEEEEEETTSCEEEEECCTTSTTCSCCCSTTGGGSCEECCCCSCEEEEEECSSEEEEEETTSCEEEEECEEETTEEEESSBBTBCEEEEEEECCSSCEEEEEECSSEEEEEETTSCEEEEECCTTSTTCSCGGGTSSSCGGGGHHHHHSCEECCCBCSSCCSBCCEEEEEEETTEEEEEETTCCEEEEECCTTSTTSCSSCSCEEEEEECGGGCCTTCCEEEEEECSSEEEEEETTSCEEEEEC…
71a17APPADGALKRAEELKTQANDYFKAKDYENAIKFYSQAIELNPSNAIYYGNRSLAYLRTECYGYALGDATRAIELDKKYIKGYYRRAASNMALGKFRAALRDYETVVKVKPHDKDAKMKYQECNKIVKQKAFERAIAGDEHKRSVVDSLDIESMTIEDEYSCCCHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHTTCHHHHHHHHHHHHHHSTTCHHHHHHHHHHHHHTTCHHHHHHHHHHHHHHCTTCHHHHHHHHHHHHHTTCHHHHHHHHHHHHHHSTTCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCTTCCCCCSCC
81a1xAAGEDVGAPPDHLWVHQEGIYRDEYQRTWVAVVEEETSFLRARVQQIQVPLGDAARPSHLLTSQLPLMWQLYPEERYMDNNSRLWQIQHHLMVRGVQELLLKLLPDDCCCCCCCCCCEEEEEECCEEEECCCCEEEEEEEECCCCEEEEEECCCCCCCCCCCHHHHCCCCCCCEEEEECCCEEEECCCCEEEEEEEEEECCEEEEEEEECCCCCCCCCCCCCSEEEEEETTEEEETTSCEEEEEEEECSSCEEEEEECCCCCCCSCCCHHHHTTCSSCSEEEEETTTEEEETTSCEEEEEEEEEETTEEEEEEEECCCC
91a27AARTVVLITGCSSGIGLHLAVRLASDPSQSFKVYATLRDLKTQGRLWEAARALACPPGSLETLQLDVRDSKSVAAARERVTEGRVDVLVCNAGLGLLGPLEALGEDAVASVLDVNVVGTVRMLQAFLPDMKRRGSGRVLVTGSVGGLMGLPFNDVYCASKFALEGLCESLAVLLLPFGVHLSLIECGPVHTAFMEKVLGSPEEVLDRTDIHTFHRFYQYLAHSKQVFREAAQNPEEVAEVFLTALRAPKPTLRYFTTERFLPLLRMRLDDPSGSNYVTAMHREVFGCCEEEEECCCCCHHHHHHHHHHHCCCCCCEEEEEEECCHHHCHHHHHHHHHCCCCCCCEEEEECCCCCHHHHHHHHHCCCCCCCCEEEECCCCCCCCCHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEEEEHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCEEEEEEEECCECCCCCCCCCCCHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCECHHHHHHHHHHHHHCCCCCCEEECCCCCHHHHHCCCCCCCCHHHHHHHHHHHHCCCEEEEESCCSSHHHHHHHHHHHTCTTCCEEEEEEESSGGGTHHHHHHHHHTTCCTTSEEEEECCTTCHHHHHHHHHTCTTSCCSEEEECCCCCCCSCGGGCCHHHHHHHIIIIIIHHHHHHHHHHHHHHHHTCEEEEEEEEGGGTSCCTTCHHHHHHHHHHHHHHHHHHHHHGGGTEEEEEEEECCBSSSTTTTSCCCHHHHHHHSCHHHHHHHHHHHHHHHHHHHHHCBCHHHHHHHHHHHHHCSSCCSEEESCSTTHHHHHTTTSSTTSHHHHHHHHHHHHC

CREATE TABLE pdb_31_07_2011 (
  "unnamed_0" BIGINT,
  "pdb_id" VARCHAR,
  "seq" VARCHAR,
  "sst3" VARCHAR,
  "sst8" VARCHAR
);

Share link

Anyone who has the link will be able to view this.