Pca Trading Strategier


Jeg har vært opptatt av å forske på handelsstrategier knyttet til PCA til trading med rentepenger futures instrumenter Tilsynelatende er PCA ofte brukt i dette området Jeg ser bare etter noen referanser for å få en grunnleggende ide om hvordan en strategi kan se ut som om jeg ikke ser etter en vinnende strategi - bare en oversikt over hvordan PCA kan være nyttig for å generere handelssignaler. Jeg forstår matematikken bak PCA og har brukt den på andre områder, men søknadene om å finansiere er nye for meg. Skrevet den 6. januar kl. 18 13. En av De beste brikkene som er skrevet om dette emnet, er Salomon s Principles of Principal Components, som er lett tilgjengelig på Internett. Jeg vil ikke gå inn i detaljene, siden dette papiret er latterlig omfattende, men den grunnleggende ideen er enkel - hvis du kjører en PCA basert på utbytte, tar de tre første komponentene mesteparten av avvikene sammen, med de tre faktorene som i grove grad tolkes som nivået, skråningen og kurven i kurven. Den mest brukte søknaden for PCA er sommerfuglhandel, for eksempel kan du kjøpe TY-kontrakten mot FV og WN eller du kan kjøpe EDZ6 mot EDZ5 og EDZ4 PCA gjør at du kan beregne risikovekter som trengs, slik at konstruksjonene er nøytrale til de to første hovedkomponentene. Dette lar deg fokusere om handel med kurvkurvene i rentekurven uten å ta på seg nivåhellingskonsentrasjoner. Ansatte Jan 6 15 på 19 39. Det er en empirisk observasjon, men veldig mye et resultat av hvordan rentekurven blir handlet oppfører seg. Hvis dekomponering av obligasjonsporteføljen over lang tid horisonter, vil du nesten alltid finne ut at varigheten, dvs. utbyttenivået, ganske mye er den viktigste faktoren, det er også det som folk snakker om det 10-årige avkastningen, gjorde BLAH i dag. Slope er definitivt den neste tingen som er på folks sinn. avkastningskurve tøft flatt bjørn steepened osv i dag Krølling er nesten aldri nevnt i pressen, og er faktisk en mye mindre faktor i å drive daglige avkastningskurver bevegelser Helin Gai 6 jan kl 21 21.Du har en multifaktorell modell som tar som innganger om 10,20 eksogene svake stasjonære variabler. Da kan du bruke PCA til å få bare 3,4 ortogonale variabler for å forenkle modellen uten å miste for mye informasjon. Det kan for det første 3.4 hovedkomponenter forklare mer enn 90 av de 10.20 originale variablene totalvariasjon For eksempel bruker tekniske forhandlere ofte mange ta indikatorer, for eksempel MACD, RSI, stokastiske og så videre er det sannsynlig at den første hovedkomponenten av disse indikatorene forklarer mer enn 95 av alle indikatorvarianter Lisa Ann 2 mai 13 på 9 54.To svar på spørsmålene dine må vi se på hva det gjør. PCA er matematisk definert som en ortogonal lineær transformasjon som forvandler dataene til et nytt koordinatsystem, slik at nyhetsvektorer er ortogonale og forklarer hoveddelen av variansen til den første sett. Det tok en N x M matrise som input, N representerer differents repetisjon av eksperimentet og M resultatene av en bestemt probe Det vil gi deg retninger eller hovedkomponenter som forklarer variansen av datasettet. Så alt avhenger av hva du skriver inn i PCAen din. Jeg bruker PCA for å se på markedskorrelasjon, så jeg skriver inn M-priser over N ganger. Du kan skrive inn ulike målgriller, futures av en enkelt aksje for å se på dens dynamikk Min bruk vil gi sammenhengen mellom en aksjekurs med markedet, kjent som beta, den andre bruken vil gi sammenheng mellom ulike tekniske indikatorer på en aksje. Og jeg antar at du kan få noen interessante resultater med differents indikatorer over differents stocks. Don ikke glemme forbehandling Som du kan se her Datasynkronisering er det noen vanskelige problemer med markedsdata. Det avhenger også av hva du gjør med resultatene Du kan bruke noen kriterium for å fjerne komponenter med lite varianse til redusere dimensjonen av datasettet Dette er det vanlige målet med PCA Det gir deg et redusert antall aksjer for å bygge en portefølje, for å estimere resultatrisikokurver, men du kan også gjøre mer komplekse post-tr spisning Her kan du se en bruk av PCA kombinert med tilfeldig matrise teori for å fjerne støy fra markedet. PCA er et verktøy, et veldig kraftfullt verktøy, men bare et verktøy Dine resultater vil avhenge av hvordan du bruker det Risikoen er å bruke det for mye Du vet hva de sa, hvis du har en hammer, ser hvert problem ut som en negle. I et tidligere innlegg presenterer jeg hvordan man kan bruke hovedkomponentanalysen til å utlede risikofaktorer. Også ved hjelp av PCA kan den forskjellige egenporteføljen være sett på som parhandel på nivå av sektorer Ideen bygger på sammenhengsprinsippet se Avellaneda 2002 når selskapene er sortert i henhold til deres koeffisienter i en gitt egenvektor, grupperes selskaper av samme bransje eller sektor sammen. Plottet av de sorterte koeffisientene mot de tilsvarende selskapene bidrar til å legge merke til at naboene til et bestemt selskap har en tendens til å være i samme bransjegruppe. I dette innlegget presenterer jeg en metode for parhandel der parene dannes ved hjelp av PCA og cohere nc-prinsippet Dette er bare en måte å gjøre, jeg presenterer en metodologi. Samholdsprinsippet holdes i dette tilfellet, gruppene av samme bransje er gruppert sammen For illustrasjonsformål bruker jeg de øverste aksjene i den tredje egenvektoren. Disse aksjene tilhører samme sektor Basic Materials. Jeg velger to kandidater for å teste parhandelsstrategien SWN og CNX. Jeg hevder ikke at dette er det beste valget eller den beste strategien, som jeg sa, dette er bare en må-gjøre. For enkelhet , De to seriene er i samme fil. Her er R-koden. Last inn library. library tseries Les en fil som heter R. Definer de to variablene som brukes til å teste pair trading strategy. swn dataS, 2 cnx dataS, 3. Enkel lineær regresjonsmodell uten avskjæring og konstruksjon av spredningen S y-hedgeratio x beta som representerer modellens første koeffisient er hedgeratio. cnx 0 beta coef lmresult 1 spredt swn-beta cnx. Test for kointegrasjon ved hjelp av Augmented Dickey-Fuller testen for unit root Testen utføres på 5 nivå. resCADF alternativ stasjonær, k 0 hvis 0 05 cat Spredningen er sannsynligvis mean-reverting n else cat Spredningen er ikke mean-reverting n. Separat dataene i treningssett og testsett til Backtest parhandelsstrategien og optimaliser parametrene. definere indekser for trening set. trainset 1 100 1 lengde dataS, 1 2 testsett lengde togsett 1 lengde dataS, 1. bestemmer sikringsforholdet på treningssettet Enkel lineær regresjonsmodell på togsett bestemmer spredningen.0 cnx togsett, hedgeratio coef lmresult 1 spredt swn-hedgeratio cnx plot spread, type l. beskrivelse av Spread. spreadMean gjennomsnittlig spredt togsett, katt Spread Mean, spreadMean, n spreadStdDev sd spredt togsett, cat Spead Standard Deviation, spreadStdDev, n. Z-poeng av spredningen. Definert strategi Kjøp Spread når verdi faller under 2 standardavvik og shortspredning når verdien øker over 2 standardavvik zcore har standardavvik 1. Exir posisjoner når spredningen innenfor 1 standardavvik av dens gjennomsnitt. Definer posisjonene matrix. posMatrix matrise NaN, lengde dataS, 1, 2 posMatrix longPos, 1 1 posMatrix longPos, 2 -1 posMatrix shortPos, 1 -1 posMatrix shortPos, 2 1 posMatrix existPos, 0.Return dataS, 2 3 - lagg dataS , 2 3 lagg dataS, 2 3.sharpeTrainset sqrt lengde togsett betyr pnl 2 lengde togsett sd pnl 2 lengde togsett katt skarverforholdet på treningssettet er sharpeTrainset, n. Sharpe Ratio på testset. sharpeTestset sqrt lengde testsett gjennomsnittlig test test sd pnl testsett katt skarphet forholdet på test sett er, sharpeTestset, n. Lagg funksjon lagg-funksjon xy matrise NaN, lengde dataS, 1, 2 y 2 lengde dataS, 1, 1 x 1 lengde dataS, 1 -1, 1 y 2 lengde dataS, 1, 2 x 1 lengde dataS, 1 -1, 2 returnere y.

Comments