Mewnforio data o PDF i Excel trwy Power Query

Mae’r dasg o drosglwyddo data o daenlen mewn ffeil PDF i ddalen Microsoft Excel bob amser yn “hwyl”. Yn enwedig os nad oes gennych feddalwedd adnabod drud fel FineReader neu rywbeth felly. Nid yw copïo uniongyrchol fel arfer yn arwain at unrhyw beth da, oherwydd. ar ôl gludo'r data a gopïwyd ar y ddalen, mae'n debyg y byddant yn “glynu at ei gilydd” mewn un golofn. Felly bydd yn rhaid eu gwahanu'n ofalus gan ddefnyddio teclyn Testun gan golofnau o'r tab Dyddiad (Data - Testun i Golofnau).

Ac wrth gwrs, dim ond ar gyfer y ffeiliau PDF hynny lle mae haen destun y mae copïo'n bosibl, hy gyda dogfen sydd newydd gael ei sganio o bapur i PDF, ni fydd hyn yn gweithio mewn egwyddor.

Ond nid yw mor drist, a dweud y gwir 🙂

Os oes gennych Office 2013 neu 2016, yna mewn ychydig funudau, heb raglenni ychwanegol, mae'n eithaf posibl trosglwyddo data o PDF i Microsoft Excel. A bydd Word and Power Query yn ein helpu yn hyn o beth.

Er enghraifft, gadewch i ni gymryd yr adroddiad PDF hwn gyda chriw o destun, fformiwlâu a thablau o wefan Comisiwn Economaidd Ewrop:

Mewnforio data o PDF i Excel trwy Power Query

… a cheisiwch dynnu allan ohono yn Excel, dywedwch y tabl cyntaf:

Mewnforio data o PDF i Excel trwy Power Query

Awn ni!

Cam 1. Agor PDF yn Word

Am ryw reswm, ychydig o bobl sy'n gwybod, ond ers 2013 mae Microsoft Word wedi dysgu agor ac adnabod ffeiliau PDF (hyd yn oed rhai wedi'u sganio, hynny yw, heb haen destun!). Gwneir hyn mewn ffordd gwbl safonol: agor Word, cliciwch Ffeil - Agor (Ffeil - Agored) a nodwch y fformat PDF yn y gwymplen yng nghornel dde isaf y ffenestr.

Yna dewiswch y ffeil PDF sydd ei hangen arnom a chliciwch agored (Agored). Mae Word yn dweud wrthym ei fod yn mynd i redeg OCR ar y ddogfen hon i anfon neges destun:

Mewnforio data o PDF i Excel trwy Power Query

Rydym yn cytuno ac mewn ychydig eiliadau byddwn yn gweld ein PDF ar agor i'w olygu eisoes yn Word:

Mewnforio data o PDF i Excel trwy Power Query

Wrth gwrs, bydd y dyluniad, arddulliau, ffontiau, penawdau a throedynnau, ac ati yn rhannol yn hedfan oddi ar y ddogfen, ond nid yw hyn yn bwysig i ni - dim ond data o dablau sydd ei angen arnom. Mewn egwyddor, ar hyn o bryd, mae eisoes yn demtasiwn i gopïo'r tabl o'r ddogfen gydnabyddedig i Word a'i gludo i Excel. Weithiau mae'n gweithio, ond yn amlach mae'n arwain at bob math o ystumiadau data - er enghraifft, gall rhifau droi'n ddyddiadau neu aros yn destun, fel yn ein hachos ni, oherwydd. Mae PDF yn defnyddio rhai nad ydynt yn wahanwyr:

Mewnforio data o PDF i Excel trwy Power Query

Felly gadewch i ni beidio â thorri corneli, ond gwneud popeth ychydig yn fwy cymhleth, ond yn iawn.

Cam 2: Cadw'r Ddogfen fel Tudalen We

I lwytho'r data a dderbyniwyd i Excel (trwy Power Query), mae angen cadw ein dogfen Word yn fformat y dudalen we - mae'r fformat hwn, yn yr achos hwn, yn fath o enwadur cyffredin rhwng Word ac Excel.

I wneud hyn, ewch i'r ddewislen Ffeil - Cadw Fel (Ffeil - Cadw Fel) neu gwasgwch yr allwedd F12 ar y bysellfwrdd ac yn y ffenestr sy'n agor, dewiswch y math o ffeil Tudalen we mewn un ffeil (tudalen we - ffeil sengl):

Mewnforio data o PDF i Excel trwy Power Query

Ar ôl arbed, dylech gael ffeil gyda'r estyniad mhtml (os gwelwch estyniadau ffeil yn Explorer).

Cam 3. Lanlwytho'r ffeil i Excel trwy Power Query

Gallwch agor y ffeil MHTML a grëwyd yn Excel yn uniongyrchol, ond yna byddwn yn cael, yn gyntaf, holl gynnwys y PDF ar unwaith, ynghyd â thestun a chriw o dablau diangen, ac, yn ail, byddwn yn colli data eto oherwydd anghywir gwahanyddion. Felly, byddwn yn mewnforio i Excel trwy'r ategyn Power Query. Mae hwn yn ychwanegiad hollol rhad ac am ddim y gallwch chi uwchlwytho data i Excel o bron unrhyw ffynhonnell (ffeiliau, ffolderi, cronfeydd data, systemau ERP) ac yna trawsnewid y data a dderbynnir ym mhob ffordd bosibl, gan roi'r siâp a ddymunir iddo.

Os oes gennych Excel 2010-2013, yna gallwch chi lawrlwytho Power Query o wefan swyddogol Microsoft - ar ôl ei osod fe welwch tab Ymholiad Pwer. Os oes gennych Excel 2016 neu fwy newydd, yna nid oes angen i chi lawrlwytho unrhyw beth - mae'r holl swyddogaethau eisoes wedi'u cynnwys yn Excel yn ddiofyn ac wedi'i leoli ar y tab Dyddiad (Dyddiad) mewn grŵp Lawrlwytho a Throsi (Cael a Thrawsnewid).

Felly rydyn ni'n mynd naill ai i'r tab Dyddiad, neu ar y tab Ymholiad Pwer a dewis tîm I gael data or Creu Ymholiad - O Ffeil - O XML. I wneud ffeiliau XML yn weladwy nid yn unig, newidiwch yr hidlwyr yn y gwymplen yng nghornel dde isaf y ffenestr i Pob ffeil (Pob ffeil) a nodwch ein ffeil MHTML:

Mewnforio data o PDF i Excel trwy Power Query

Sylwch na fydd y mewnforio yn cwblhau'n llwyddiannus, oherwydd. Mae Power Query yn disgwyl XML gennym ni, ond mae gennym ni fformat HTML mewn gwirionedd. Felly, yn y ffenestr nesaf sy'n ymddangos, bydd angen i chi dde-glicio ar y ffeil sy'n annealladwy i Power Query a nodi ei fformat:

Mewnforio data o PDF i Excel trwy Power Query

Ar ôl hynny, bydd y ffeil yn cael ei hadnabod yn gywir a byddwn yn gweld rhestr o'r holl dablau sydd ynddo:

Mewnforio data o PDF i Excel trwy Power Query

Gallwch weld cynnwys y tablau drwy glicio botwm chwith y llygoden yn y cefndir gwyn (nid yn y gair Tabl!) y celloedd yn y golofn Data.

Pan ddiffinnir y tabl a ddymunir, cliciwch ar y gair gwyrdd Tabl – ac rydych chi'n “syrthio drwodd” i'w gynnwys:

Mewnforio data o PDF i Excel trwy Power Query

Mae angen gwneud ychydig o gamau syml i “gribo” ei gynnwys, sef:

  1. dileu colofnau diangen (cliciwch ar y dde ar bennyn y golofn - Dileu)
  2. rhoi atalnodau yn lle dotiau (dewiswch golofnau, de-gliciwch - Amnewid gwerthoedd)
  3. dileu arwyddion cyfartal yn y pennawd (dewiswch golofnau, de-gliciwch - Amnewid gwerthoedd)
  4. tynnu'r llinell uchaf (Hafan - Dileu llinellau - Dileu llinellau uchaf)
  5. tynnu llinellau gwag (Cartref - Dileu llinellau - Dileu llinellau gwag)
  6. codwch y rhes gyntaf i bennawd y bwrdd (Cartref – Defnyddiwch y llinell gyntaf fel penawdau)
  7. hidlo data diangen allan gan ddefnyddio hidlydd

Pan ddaw'r bwrdd i'w ffurf arferol, gellir ei ddadlwytho ar y ddalen gyda'r gorchymyn cau a llwytho i lawr (Cau a Llwyth) on Y prif tab. A byddwn yn cael y fath harddwch y gallwn eisoes weithio ag ef:

Mewnforio data o PDF i Excel trwy Power Query

  • Trawsnewid Colofn i Dabl gydag Ymholiad Pŵer
  • Rhannu testun gludiog yn golofnau

Gadael ymateb